<listing id="hg8pw"></listing>

    當前位置:首頁  媒體中心  媒體/觀點

    《中國社會科學報》| 周亞虹 張征宇:用于政策評估的計量經濟學:問題、前沿與展望

    時間:2019-09-02

    來源:《中國社會科學報2019年8月28日第4版 作者:周亞虹 張征宇

    我國正處于改革攻堅階段和發展關鍵時期。在努力實現經濟增長方式轉變與產業結構優化的過程中,一項重要的任務是對國家與地方出臺的各項政策,特別是經濟政策予以正確評估,以便發現問題、總結經驗,對政策適時微調,為制定新政策與配套措施提供借鑒。政策評估計量經濟學(econometrics of policy evaluation)是現代計量經濟學的前沿分支之一,它將自然試驗的思想與結構模型相結合,通過發展識別估計各種因果效應的統計推斷方法,為科學評估政策的有效性與利弊得失提供方法論支持。

      經濟系統的高度復雜性、有限理性個體的自選擇行為以及可獲得數據的局限性,使得評價一項政策或一次重大事件的影響并不像看起來那樣容易。利用大容量的微觀數據評估一項政策的難點主要在于以下三方面。

      第一,數據缺失問題。假設政府準備實施一項旨在鼓勵企業通過技術升級提升生產率的政策。假如可以同時觀測到同一家企業在該政策實施前的生產率Y0以及政策實施后的生產率Y1,那么二者之差無疑度量了政策對該企業的凈效應。但是,現實中我們一般只能觀測到個體在已實現狀態下的結果,即Y=DY1+(1-DY0),其中D=1表示個體參與了政策,D=0表示個體未參與政策。這意味著無法識別單個企業的政策效應。以上問題被稱為政策評估的根本問題。為了克服它,經濟學家需要在一定假設下,利用已知數據預測個體在未知處理狀態下出現的反事實結果。

      第二,混雜因素(confounder)的干擾問題。在政策評估的許多問題中,簡單地將事件發生前后的結果做差分,得到的估計量往往同時混合了政策效應之外其他干擾因素的影響。例如,需要評估國家某一重大經濟刺激政策對某一地區GDP的拉動作用。簡單地將該地區在政策實施前后的GDP相減后得到的數值,至少混合了以下三個因素的作用:一是該重大經濟刺激政策對GDP的作用;二是與該重大政策同時發生的,其他中小規模政策對經濟的影響;三是即使沒有任何經濟政策,該地區自然的經濟增長。為了從各種混雜因素中剝離出所要研究政策的凈效應,計量經濟學常用的方法是傾向得分匹配法(propensity score matching, PSM)以及雙重差分法(difference in differences, DID)。

      第三,不可觀察的個體異質性。這是微觀數據的基本特性之一。在政策評估中,不可觀察異質性主要帶來兩方面的問題。首先,個人在決定是否參與政策時,不可觀察的個人偏好以及對政策后果的理性預期與結果方程中的擾動項產生相關,導致政策不再是一場真正意義上的自然試驗,因而具有內生性。這種由不可觀測變量導致的內生性無法由PSM加以消除,經常需要工具變量的介入。這為識別與估計政策效應帶來了難度。其次,越來越多的經濟學家發現,即使控制了所有觀測變量,政策對個體的影響依然因人而異。近年來,計量經濟學家開始轉向對政策分布/分位數處理效應的識別與估計,這一趨勢體現了對政策評估中不可觀察異質性的關注與重視。

      數據缺失等問題導致政策效應一般不能在個體層面得到識別。常用的度量政策效應的參數包括平均處理效應(average treatment effect, ATE),它是個體處理效應在整個人群上的期望值,反映了政策效應對所有人的平均值。除此以外,還有處理組平均效應(average treatment effect on the treated, ATET),它是個體處理效應在處理組人群上的期望,反映了政策效應在受到政策影響那部分個體中的平均值。無論ATE還是ATET,它們的共同特點是用單一參數簡潔刻畫政策對某個感興趣群體的平均效應。

      近年來,研究者在利用處理效應模型評估經濟政策時,越來越重視分析政策的分位數處理效應(quantile treatment effect, QTE)與分布處理效應(distributional treatment effect, DTE),而不僅僅著眼于ATE。出現這種趨勢,一方面是因為政策對因變量分布尾端人群的影響程度往往不同于對因變量分布中段人群的影響;另一方面,眾多有關社會福利、平等性問題的回答都有賴于研究者了解政策效應在整個受眾人群中的分布情況。以中國在1999年起實行的大學擴招政策為例。在短短幾年內,中國的高等教育迅速由精英教育過渡到大眾教育時代。目前中國高等教育毛入學率達到40%,普通高等院校年招生規模突破700萬大關,居世界第一。長久以來,對高等教育擴張的討論焦點之一就是擴招政策是否真的有助于減少收入不平等,增進社會公平。如果只估計由大學擴招引起的教育回報率變化的ATE,那么充其量只能了解到這一政策提升了人們的平均工資,但是難以知道政策如何影響不同時期人們的工資分布,從而無法回答有關收入不平等方面的問題。為了回答有關收入不平等的問題,可以通過估計在擴招政策實施不同時期的QTE/DTE,幫助理解政策帶來的異質性影響。

     利用PSM識別政策效應依賴于較強的條件外生性假設。條件外生性是指當控制了一組可觀測的變量X后,D和(Y1,Y0)互相獨立的情形。在實際中,個體在決定D的取值時,其決策過程依賴于一些研究者無法觀測到的,包括個人能力、稟賦和風險偏好等因素。同時這些因素反過來影響(Y1,Y0)。例如,在研究接受高等教育對個人工資提升作用的過程中,D=1表示讀了大學,D=0表示未讀大學。不可觀察的個人能力通過學習成績來決定這個人是否能夠考進大學。與此同時,個人能力也與其在勞動力市場的表現密切相關。在這種情況下,即使控制了可觀測的個體特征,D和(Y1,Y0)仍然相關。此時需要工具變量的介入才能一致地估計出讀大學對工資的凈效應。

      當某一政策實施以后,盡管可以同時觀察到處理組中政策前后的變化,但這個變化同時包含了政策的處理效應和不可觀測的時間趨勢的變化。如果假設時間趨勢在處理組和對照組的變化是相同的,那么可以采取兩次差分的方式,將共同的時間趨勢剔除出去,從而得到平均處理效應的估計值。這就是DID方法的思想。DID的主要優勢在于計算簡便,可以接受某種形式的選擇性誤差,但主要問題在于,處理組和對照組之間必須保持相同時間趨勢的假設有時不符合現實,且較難檢驗。

      當是否接受政策影響的概率成為一個非連續函數時,斷點回歸(regression discontinuity design, RDD)成為近年來非常熱門的估計“準實驗”政策處理效應的方法。當選擇變量與是否接受處理效應的關系是確定時,經濟學家通常使用精確斷點回歸(sharp RDD)。當選擇變量與是否接受處理效應存在隨機關系時,即是否接受處理效應的同時受到一些不可觀測的選擇變量影響時,通常使用模糊斷點回歸(fuzzy RDD),這是一個類似于兩步法處理工具變量的估計方法。

      近幾年來,微觀計量經濟學在政策評估方面取得較快發展。由于大數據時代的來臨,這一領域也面臨更多的發展機遇與挑戰。大數據背景下的政策評估計量經濟學不僅符合經濟學術發展的前沿,而且能夠滿足國家發展的重大需求。大致來看,該領域未來的發展方向可能包括以下幾個方面。

      第一,諾貝爾經濟學獎獲得者詹姆斯·赫克曼(James Heckman),同時也是政策評估計量經濟學發展的領軍人物,曾明確提出政策干預的微觀計量評估的三大任務:一是評估已實施政策的效應;二是預測已實施政策在新環境、新人群中將要產生的效應;三是預測尚未實施的新政策在新的環境中將要產生的效應?,F有關于政策評估的大部分研究只關注第一點。鑒于政策制定者經常需要在實踐中發現問題、總結經驗、對政策做出及時微調,并制定新的政策與相關配套措施,上述第二、三項任務將是未來該領域的重點發展方向之一。

      第二,更加注重對異質性政策效應的識別、估計和推斷。已有能夠反映政策效應異質性的參數包括分位數處理效應與分布處理效應。實際上,分位數處理效應還可以分成條件分位數處理效應與無條件分位數處理效應,兩者在名稱上接近,但是識別與估計的步驟相去甚遠。另外,盡管DID方法已經成為政策評估的常用方法之一,但是用此方法的研究基本上只關注ATE類型參數的識別和估計。如何在DID模型中反映出政策異質性效應并加以識別,將是一個值得研究的問題。

      第三,目前大部分處理效應模型呈現出以下特點:只適用于單截面數據,或者兩期數據(例如DID);政策變量多為0/1取值變量。將已有結果拓展到利用多期面板數據進行政策評估、連續取值的政策變量的評估,以及動態處理效應模型將是未來可以研究的方向。動態處理效應模型是指一個政策分兩階段實施,人們可以在第二階段開始前根據第一階段實現的結果自由選擇是否繼續參與下一階段的政策,此時第一階段的結果將會影響個人是否參與第二階段的決策。

    ?。ㄗ髡邌挝唬荷虾X斀洿髮W經濟學院)

    返回原圖
    /

    新浪彩票