尋夢新聞LINE@每日推播熱門推薦文章,趣聞不漏接❤️
模型在微觀實證研究中的作用
—以城市和區域經濟學為例
作者:張俊富,約翰斯•霍普金斯大學經濟學博士,現為美國克拉克大學經濟系教授,主要研究城市與區域經濟學,論文發表在Review of Economics and Statistics, Journal of Urban Economics等城市和區域經濟學領域的國際頂尖學術期刊
來源:《經濟資料譯叢》2019年第1期
01. 引言
作為經濟學者,我的專業領域是城市和區域經濟學,近年來主要研究中國城市化進程中的一些問題。因為這個原因,我一直關注國內的學者在這方面的研究,在學術會議上和為期刊審稿的過程中,經常接觸國內同行的論文。我從國內同行的實證研究中學到很多,他們在研究中所體現出的關心現實問題、努力挖掘數據、強調因果識別、注重政策影響等特點,十分值得提倡和借鑒。
同時我有一個感覺(當然也可能是錯覺),就是國內同行的大部分實證研究不用經濟學理論模型,而以獨立的回歸分析為主,即使提到理論,也多是文字性的描述,較少做數學推導。其實這些同行絕大多數是國內外正統經濟學系的博士,我相信他們都在研究生院里接受過嚴格的理論訓練,對理論模型並不陌生,但在研究的實踐中較少使用這方面的技能,似乎形成了一種風氣。
2018年9月初,我在南京參加了一個城市和區域經濟學會議。因為有很多國內的年輕同行參會,我就決定利用這個機會討論一下理論模型在實證研究中的作用。我想表達的觀點是:我們領域大量的實證研究是以模型為依托的,這是因為模型有很多不同的作用;年輕學者應該重視建模的技能;否則的話,如果總是脫離模型來做研究,不但會影響研究的深度,也會限制選題的廣度。
這篇短文是把會上的發言整理出來,做了一些擴充,為的是理清自己的思路,以便繼續跟同行們討論這個重要問題。因為專業的背景,我這里列舉的文獻基本都來自於城市和區域經濟學。但是我相信,這里的主要觀點也適用於其它的應用微觀經濟學領域,包括勞力、發展、環境、貿易、產業組織等。
02. 經濟科學、實證研究以及模型的用途
在談模型的應用之前,我需要講講什麼是實證研究和什麼是模型。而在此之前,我必須明確一點,那就是:我們這些以學術為職業的經濟學家做的是科學研究。所謂科學,是一個領域的知識的總和;而這些知識是由這個領域的研究人員群體通過從事以下四類活動一點點積累起來的:
(1) 記錄 (Documentation) —— 通過觀察和測量把現實中可能有必要去研究的現象、規律以及變量之間的關係等記錄或描述下來。
(2) 理論化 (Theorization) ——對現實中的現象、規律以及變量之間的關係等給出一個合乎邏輯且可供檢驗的解釋。
(3) 檢驗 (Verification)——用通過觀測或實驗所得來的數據對理論的含義 (implication) 和推測 (prediction) 進行檢驗。得到驗證的理論當然也不一定就正確,但是我們對它的信心會增強;跟現實不符的理論需要去修正(即回到(2))。
(4) 應用 (Application)——用現有的理論解釋更多的現象、規律和變量之間的關係;用現有的理論幫助解決現實問題。
這一套積累知識的方法,就是我們通常所說的科學的方法。用這套方法研究自然現象,就形成了自然科學,如物理、化學、生物等;用這套方法研究人類行為和社會現象,就形成了社會科學,如經濟學、心理學等。
我們在經濟學的文獻里不難列舉出上面每一類的工作。Burchfield et al. (2006) 用衛星遙感數據對城市蔓延的刻畫、我本人參與的對小企業是否創造了更多就業的研究 (Neumark et al., 2011),都是記錄一類的工作。Henderson (1974) 關於城市為什麼有大有小的解釋,就是理論化的工作。Hamilton (1982) 以及後續的關於「浪費性通勤」 (wasteful commuting) 的研究 (White, 1988;Small和Song, 1992),都是要驗證單中心城市理論的一個推論,屬於檢驗一類的工作。而Au和Henderson (2006) 關於中國的城市規模是不是普遍小於最優規模的研究,則是用現存的理論回答大家關注的一個現實問題,屬於應用一類的工作。上述(1)、(3)、(4) 三類工作都涉及數據的應用,都可以看作是實證研究(empirical research)。
那麼,什麼是模型 (model) 呢?模型是一個簡化的現實世界 (a simplified representation of reality)。真實世界很複雜,我們在做科學研究時,經常需要忽略真實世界的某些方面,只關注跟手頭的問題最相關的現實。尤其是在試圖解釋真實世界里的某個現象時,我們往往需要借助於一個經過簡化的、用來代表真實世界的東西來表述我們的想法,我們管它叫做模型。不光是經濟學家,各個科學領域的學者都使用模型,特別是在做理論化的工作時。
(圖片來源:https://www.gtsimulators.com/Orbiter-Model-p/h101.htm; https://arresspro.com/ dna-model)
圖一是自然科學家們使用的兩個模型。以左邊的地球運行軌道模型為例,我們很容易能認識到,它是個經過簡化的真實世界。簡化有兩類,一類是直接忽略現實中的某些方面。比如這個軌道模型就省略了地球和太陽之間的水星和金星。另一類簡化是對現實世界的扭曲(distortion)。譬如這個模型里的太陽就被縮小了很多倍;相對於地球和月亮,真實的太陽要大得多。太陽和地球之間的距離¾相對於地球的半徑來說¾也被縮小了很多。這個模型雖然被簡化得不真實了,卻很有用:我們如果借助於它來解釋地球上日食和月食的成因(講解特定的理論),就特別容易讓別人理解。
▲ 圖一:模型兩例
與此類似,右邊的脫氧核糖核酸(DNA)模型也做了簡化,例如每個鹼基(兩條螺旋鏈之間互補配對的部分)的分子結構都比模型中顯示的複雜得多。我們雖然沒有親眼見過DNA,也能猜出它的每一部分之間不會有那麼明顯的顏色對比,模型設計者扭曲了顏色以便讓我們更能看清DNA的結構。這兩個例子告訴我們,科學研究人員做的模型,目的不是求真實,而是求有用、能幫助他們展示和表述理論。
經濟學家用的模型也是一樣的。我們也做簡化:有的模型直接忽略了政府的存在;有的假設這世界上只有兩個國家、兩種產品。不同的是,我們經濟學家不經常使用實物模型,而是用圖形和數學方程式。 也就是說,除了簡化,我們還做了抽象化,譬如用曲線上每一點的高度代表消費者的支付意願、用函數關係代表企業的生產技術約束、等等。從這個角度來說,經濟學家使用的模型特別像是地圖(Krugman, 1994)。 地圖也做簡化,譬如交通圖會忽略地面的建築、地鐵路線圖會把彎道拉直;地圖也做抽象化的處理,有寬度的街道變成了一條細線、奇形怪狀的城市變成了一個圓點等等。地圖不真實,但是我們都知道它有用。有意思的是,正是地圖的不真實,讓它變得更有用:想找行車路線的人,會上網查Google地圖,很少有人去查更真實的Google衛星照片。經濟學家用的模型也是一樣的,不求真實、只為有用。
由此說來,經濟學模型當然是在理論化的工作中起的作用最大。在近幾十年的經濟學發展過程中,主流經濟學理論的展示幾乎全是通過模型推導來做到的。模型也就占據了每個理論最核心的邏輯推理部分。
那麼實證經濟學研究為什麼能用到模型呢?一則是因為有一部分實證研究的目的是要檢驗理論,需要表述理論,而此時使用模型推導經常會使表述更方便、清晰、嚴謹。應用一類的實證工作因為要用到現存的理論,而現存的理論多是圍繞模型寫成的,當然也會用到模型來表述理論。
這麼說來記錄一類的工作就用不到模型了?也能用到。這跟經濟學領域的一個傳統有關。在自然科學領域,可能因為發展時間長而使得分工更細,即使是針對同一個自然現象,記錄、理論化、理論驗證的工作也完全可以由不同的研究團隊來完成。而在經濟學領域則不然,單純的記錄性的工作不太容易被發表,研究人員往往要同時做一些理論化的工作來解釋記錄的現象,才能被認為是重要的貢獻。以Eeckhout (2004) 為例,他用大量的人口普查數據來說明,美國城市人口規模服從Zipf分布的說法只適用於大城市,如果把小地方也包括進來,則服從對數正態分布。對數正態分布的一端和Zipf分布非常接近,光看大城市時不易區分。按說這個作為記錄性的工作已經不錯了,但是他在文章里繼續往下做,寫了一個模型,給對數正態分布的出現做一個理論解釋。這樣的例子有很多,即經濟學者時常把記錄性的工作和理論化的工作合併,就導致記錄性的實證研究里也常常出現理論模型。
總結來說,經濟學家和其他科學領域的研究人員一樣,要做描述現象、驗證理論和應用理論一類的實證研究。在這幾類研究中都會涉及理論,而大部分理論是用模型推導的形式表述的,就導致實證經濟學研究里會常常用到理論模型。
03. 以模型為依托的實證研究的比重
我們來做個簡單的統計,看看近年來最重要的城市和區域經濟學研究中有多少是實證研究,其中又有多少用到了理論模型。圖二對經濟學五大頂級期刊在2001-2018年間發表的城市和區域經濟學領域的論文做了分類。五大期刊當然不具有代表性,但是完全有理由認為,這些論文是本領域最具影響力的研究成果。
從圖中可以看出,純理論的研究相對很少,只占7%;絕大多數的論文屬於實證研究。這個倒也不難理解。經濟學近三十年來較少有理論突破,既沒有重大的范式改變(譬如引入理性預期的假設),也沒有新的邏輯語言的引入(譬如博弈論語言的應用),更沒有重大的理論創新。而這期間信息技術的飛速發展使數據的來源增多了,計算成本降低了,極大地促進了實證研究的發展。這個趨勢貫穿於經濟學的各個分支(Hamermesh, 2013)。
▲ 圖二:以模型為依托的實證研究的比重,2001-2018
我把實證研究按照與模型的關係細分成幾類。一類是沒有任何模型的實證分析,這一類的文章占到總數的31%。這類研究並非不涉及理論。正如上面提到的,幾乎每一種實證研究都離不開理論。這些研究沒用到模型,只是因為其中的理論相對簡單,幾句話就可以說清楚,沒必要做數學推演。以Baum-Snow (2007)為例,他想看美國高速公路系統的建立是不是推動了城市人口向郊區的轉移。這個問題的邏輯一目了然,難點在於如何解決內生性的問題,就不需要用模型。再比如,Hodler和Raschky (2014)用全球的衛星燈光數據度量經濟發展,看各國主管人的家鄉是不是經濟更加繁榮。這個問題的邏輯也不難理解,也就沒有必要用模型。我前面說到國內的學者做實證研究時一般不用理論模型,就是說他們的研究大都屬於這一類,問題的邏輯相對簡單明了,不需要借助模型來表述。
其餘超過全部研究60%的論文都用到了模型。這里面又大致可以分為三類:一類只是用模型說明道理,回歸分析中可能的並不是模型的參數,我們把這一類研究叫做「以模型為依托的、非結構性的回歸分析」;第二類不光用模型說明道理,而且所做的回歸分析的目的就是為了可能模型的參數,我們把這一類研究叫做「以模型為依托的、結構性的回歸分析」;最後一類應用的模型特別複雜,以至於模型的參數之多已經很難一次全部可能出來,不得不從他人的研究中借用一些參數的估值來進行反事實的分析,我們把這一類研究叫做「以模型為依托的、結構性的校準分析」。
我們下面就根據這個分類一一具體討論模型在每一類實證研究中的應用。
04. 模型在非結構性實證研究中的作用
先來澄清幾個概念。上面已經提到,結構性實證研究的目標就是要獲得理論模型的參數,以便用模型來估算政策的效果或事件的影響。那麼不是以獲取模型參數為目標的研究,我們就稱之為非結構性的研究。與結構性回歸分析相對應,經濟學家常常提到簡化型的回歸(reduced-form regression)。早期的理論經濟學模型經常是一組(線性)方程,每個方程是一些內生和外生變量之間的關係,方程里的系數被稱為結構性參數。直接用回歸分析可能這組方程里的系數,就是結構性回歸分析。另外一種常見的做法,是對方程組求解,把每一個內生變量表達成一組外生變量的函數,而根據這些函數用內生變量對外生變量做回歸分析,就是簡化型的回歸分析。用簡化型回歸分析可能出來的系數一般來說不是模型的參數,而是模型參數的函數。近些年來,簡化型回歸分析這個概念有了更廣義的用法,對一切從模型推演出來的或根據理論直覺寫下的變量關係所做的回歸分析,只要不是以獲取模型的參數為目標,都可以叫做簡化型回歸分析。從下面的討論中可以看到,我這里用的非結構性研究的概念,比廣義上的簡化型回歸分析涵蓋的種類還要多,包括用回歸方法尋找斷點、探究新建的指數與哪些變量相關等實證工作。
按照Holmes (2010)的說法,我們又可以把非結構性的研究細分為兩類。一類是描述性的研究,只是給出不同變量之間的相關性,而不太注重因果關係的識別。早期的實證研究大多屬於這一類。另外一類是基於實驗方法(experimentalist approach)的研究,就是通過「自然實驗」或是「可控實驗」,來識別一個變量對另一個變量的因果效應(causal effect),其目標也是要估算政策的效果或事件的影響。我在這一節雖然把Holmes所說的兩類非結構性研究合併在一起來講,但也會偶爾提及這個分類。
▷ 模型能幫助澄清實證研究的目的和意義
隨著信息技術的發展,數據越來越多,數據里的變量也越來越多,可供考察的變量之間的關係更是呈幾何級數增長。那麼我們做實證研究為什麼要去看某個特定的變量之間的關係呢?這是每一篇報告實證研究結果的論文都需要講清楚的問題,而借助於一個簡單的模型常常是把這個問題講清楚的最有效的方式。
最常見的例子是用模型闡明一個理論、導出兩個變量之間是正相關或負相關,然後用回歸分析驗證這個關係。譬如Storeygard (2016)用模型說明,運輸成本升高對遠離經濟中心的城市有更大的負面影響,他用非洲的數據檢驗這個推斷。Lee和Lin (2018)用模型導出三個不同的變量關係,例如其中之一是說自然條件優越的街區更容易成為高收入的街區並能長期保持這種地位,他們用跨時一個多世紀(1880-2010)的美國人口普查數據來驗證這些變量關係。一般來說,這類實證研究探索的是較深層次的變量之間的關係,這些關係背後的邏輯不是三言兩語就能說清楚的,所以才有利用模型來表述的必要。
另有一些實證研究檢驗更加複雜一些的理論推斷,比如說,涉及數量關係中斜率的變化或斷點的存在。譬如Glaeser和Gyourko (2005)的文章指出,房產的壽命很長,因而一個城市的房產需求在萎縮和增加時,對城市的影響是不對稱的。當需求萎縮時,房產並不會馬上消失、供給是剛性的,因而房價會大幅下跌而城市人口只是緩慢地減少;而當需求增長時,只要房價高於建設成本就會有新房上市、供給是有彈性的,因而房價會緩慢上漲而人口會迅速增加。Glaeser和Gyourko (2005)用一個簡單的模型推導出增長的城市和衰落的城市的各種不同表現,並用美國的數據對結果進行一一驗證,為我們了解衰落的城市提供了一個新穎的視角。
Card et al. (2007) 研究美國城市街區種族構成變化的「傾覆點」 (tipping point)。這個概念引起經濟學者的注意,最早始於Thomas Schelling (1969, 1971)。它是指城市里的街區一旦少數族裔的比例達到了「傾覆點」,白人居民會加速地搬出該街區,最終致使街區成為少數族裔聚居的地方。Schelling早就指出,一些看似不重要的偶然事件足以把一個街區推過這種臨界點,引起劇烈的變化。他的這個研究影響很大,其中的洞見被應用到很多別的領域甚至被寫進了暢銷書(Gladwell, 2001)。Card et al. (2007) 用一個簡單的模型,演示在什麼情況下會出現街區種族構成的「傾覆點」,並用美國的人口普查數據來可能每個城市的「傾覆點」,看它與哪些城市的特點是相關的。
上面提到的後兩篇文章用的數據是常見的普查數據,統計分析方法相當簡單,在因果識別方面沒有任何創新。這樣的文章被頂級期刊接受發表,主要是兩者都在分析重要的學術問題。嚴格說來,這兩篇文章涉及的理論問題用純文字的語言也可以講清楚。但是模型的使用¾兩篇文章都是既用了圖表又用了方程式¾無疑讓作者們把問題說得更清晰、簡潔、邏輯嚴謹,讓讀者更容易認識到實證分析的必要性。
▷模型可以給新觀察到的現象一個嚴謹的解釋
正如上面提到的,經濟學家常常把記錄和解釋現象合併在一起來做,而解釋現象時往往需要借助於模型。上面提到的Eeckhout (2004) 就是這樣的研究。作者首先用數據表明美國的城市人口規模服從對數正態分布,然後用一個模型來解釋為什麼會是這樣的。
Knoll et al. (2017)也是類似的套路。他們收集了14個發達國家在1870-2012年間的年度房價,發現二十世紀中期以前各國住房的實際價格普遍比較穩定,此後都經歷了長時間的大幅度的上升。作者們認為這不是建築成本上升的結果,而是由地價上漲造成的。他們寫了一個模型,具體解釋二戰以後什麼原因導致地價的攀升進而推高了房價。
▷模型可以導出更合理的度量方法
城市和區域經濟學關注的一個核心問題是經濟活動的集聚,有不少實證研究需要度量每個行業的集聚程度。早期的研究使用的度量方法多是臨時現抓的(ad hoc),譬如在區域的水平上計算每個行業的赫芬達爾—赫希曼指數(Herfindahl-Hirschman Index),用於衡量集聚程度。可是這樣的算法缺乏深入的思考,和集聚的理論沒有關聯,有不少缺點。打個比方說,一個島國只有兩個大小一樣的島嶼,A和B;甲行業有三個企業,每個企業有1000個雇員,其中有兩個企業坐落在島A、一個在島B;乙行業有3000個企業,每個企業有一個雇員,其中有2000個企業坐落在島A、1000個在島B。如果用傳統的度量方法,簡單地看從業人員的分布,這兩個行業的集聚程度類似,都有三分之二的雇員在島A。可是我們不難想像,甲行業的結果有可能是隨機的,並不一定表明島A有更適宜的條件;而乙行業就不同了,幾乎可以肯定有某種原因導致更多的企業出現在島A。Ellison和Glaeser (1999) 通過一個模型導出集聚的程度應該如何度量更合理,能夠剔除類似於上面這個例子中企業規模的影響;他們用 新髮明的度量方法重新來看美國各個行業的集聚程度。這個方法在後來的實證研究中被廣泛地採用(例如Rosenthal和Strange, 2001)。
種族隔離是多個社會科學領域長期關注的問題,城市和區域經濟學者一直致力於居住隔離的研究。早在1980年代,社會科學研究中用過的各類度量隔離程度的方法已經不下二十種(Massey和Denton, 1988),幾乎都是研究者臨時擬定的,沒有任何理論基礎。Echenique和Fryer (2007) 提出了一個新的度量方法。他們採用了數學家常用的公理化的方式,首先給出了一個度量隔離程度的方法需要具備的三個特點:(1) 更頻繁的同種族交往意味著隔離程度的增加;(2) 隔離程度只跟個人層面的同種族交往的比率有關而與城市的大小無關;(3) 每個人的隔離程度都和他所交往的人的隔離程度線性相關。作者接著通過模型推導證明了,這三個條件決定了一個唯一的隔離指數。他們考察這個新的指數與此前常用指數的相關程度,並用這個新指數研究學校里朋友關係網的種族隔離程度以及城市里種族間的居住隔離程度。
▷模型能指導回歸分析中函數關係的設定
我們如果在實證研究中做回歸分析,經常要做函數關係的假設:確定哪些變量應該包括在要可能的函數里、它們之間是什麼樣的函數關係。理論模型經常對函數關係的設定有指導意義。譬如Arzaghi和Henderson (2008),他們以紐約的麥迪遜大道為例來測量集聚效應。麥迪遜大道常被用作美國廣告業的代名詞,是個廣告業公司林立的地方。因為信息對廣告業至關重要,靠近同業的公司在這個行業想來應該特別有利,所以作者選擇這個行業來研究。他們對一個地方(Census tract) 一段時間內新生的廣告公司數目進行回歸分析。右邊變量包括該地點商業企業總和,以及0-250米、250-500米、500-750米、750-1000米、1000-1250米範圍內的廣告公司數量,用以估算整體和同業的集聚效應。除了這些右邊變量之外,作者只用了一個控制變量,就是地租。這是因為,作者假定新公司的誕生是利潤高的表現,而理論模型里的利潤明顯是受地租影響的,所以地租必須作為控制變量出現在要可能的函數里。其它要素價格當然也影響利潤,可是那些價格不太可能在很小的範圍內有差別,就沒有必要控制了。事實上,Arzaghi和Henderson (2008) 這個研究的重要發現之一是集聚收益大部分反映在地租上而不是在薪水里,對此前用薪水函數度量集聚收益的通行做法提出了質疑。
Glaeser et al. (1992) 也是一個例子。他們對城市里各行業就業人數的長期增長做回歸分析,看三個不同的城市增長理論哪一個更有解釋力。右邊變量里用了專業化、競爭度、多樣化三個指標來檢驗三個理論的不同含義。可是除了初始年代的就業量還需要加哪些控制變量呢?作者們用了初始年代行業內的薪水水平。這是因為,他們寫了一個簡單的模型,發現就業增長是生產率增長和薪水增長的函數,而專業化、競爭度、多樣化三個指標都是通過生產率影響就業的,所以就需要在回歸中加入薪水一類的控制變量。
值得指出的是,這兩個例子里的回歸方程式應該包括哪些控制變量,如果脫離開模型去做取舍,都不是很容易決斷的。而一旦在模型的框架下去思考,就發現作者們的選擇是理所當然的。
▷模型能幫助澄清因果關係的傳導機制
這里要舉的幾個例子,都是著重於識別因果關係的文章。正如Holmes (2010)所說的,這類研究試圖通過「自然實驗」來構造工具變量,生成外生的擾動,解決內生性的問題,從而可能一個變量對另一個變量的因果效應。因果識別做得巧妙的文章,可能出的因果效應較可信,但是無論多麼巧妙的工具變量,都難以告訴我們因果效應是通過什麼管道起的作用。講清楚究竟有哪些可能的管道,歸根到底還是個理論問題,這就給模型的使用提供了機會。
Boustan (2010) 研究美國的「白人群飛」(white flight)問題。二戰以後,美國(特別是北方的)城市里有大量的白人家庭搬到郊區去住,一種說法認為白人對少數族裔抱有偏見甚至存在歧視、不願意和少數族裔住在一個街區,他們搬到郊區去主要是為了躲避少數族裔占比越來越高的城市中心區。Boustan (2010)想考察一下這樣的說法站不站得住腳。她利用南方郡縣的自然條件來推測遷出農業的黑人總量,然後根據歷史上的移民走向來推算遷入每個北方城市的黑人數量,進而看這個外生擾動是否影響白人家庭向郊區的搬遷。作者寫了一個簡單的居住地選擇模型,假設家庭的效用取決於城里的黑人比例、便利條件和房價。從效用函數就馬上可以看出,黑人家庭的遷入不但可以通過種族偏好,也可以通過推高房價影響白人家庭的搬遷。正因為如此,Boustan (2010)用相當多的篇幅來探討「白人群飛」是否跟房價的變化有關。這個例子告訴我們,哪怕是一個極簡單的模型,也有助於我們認清可能存在的因果效應傳導機制。
Greenstone et al. (2010) 也是一篇在因果關係識別方面有所創新的文章。像中國的地方政府一樣,美國的州縣也常常從事招商引資的活動,有時甚至不惜巨額的補貼和稅收減免來吸引大企業。首要原因當然是因為引來的企業直接創造就業和 (未來的) 稅收,同時也是因為相信大企業的落戶會對地方的其它企業有影響,帶來所謂的「集聚溢出」 (agglomeration spillovers) 效應。可是準確度量這個溢出效應的大小是相當困難的,主要是因為大企業可能會選擇經濟條件前景好的地方,所以該企業落戶以後別的企業的良好表現可能是本來也會發生的。為了解決這個問題,Greenstone et al. (2010) 集中考察一些大型的「百萬元級工廠」 (「million dollar plants」), 其中每一個企業在選址期間都發生了多個地方爭奪同一企業的現象。作者們就用爭奪戰中排名第二的地方作為對照組,跟這些大企業最終落戶的地方對比來估算溢出效應。他們在進行數據分析之前,先用一個模型講清落戶的大企業會通過三種不同的管道影響原有企業:一是增加原有企業的全要素生產率,即通常所說的知識溢出效應;二是推高用工成本;三是推高地價。後兩者對原有企業的利潤是負向的影響。正因為如此,看全要素生產率的變化是對溢出效應的直接檢驗。而看新企業數量的變化則是間接的、更嚴苛的檢驗;也就是說,如果大企業落戶以後初創企業數量在增加,就意味著生產率方面的溢出效應大到足以彌補生產要素漲價的負向影響。依托於這樣的模型,每一步的回歸分析對應於哪一個機制的作用就可以表述得井井有條。
像這樣的例子還有很多。 但凡一個以因果識別為重點的實證研究,都需要探討因果效應的機制。用模型來把各種可能的機制說清楚,是常用的做法。實證研究人員寫模型的過程,就是一個深入思考傳導機制的過程。
▷模型能給可能出來的系數賦予經濟學上的含義
用商品價格對商品特徵進行回歸的做法,在實證經濟學里由來已久。直到Rosen (1974) 給出一個模型,從消費者和供應商雙方的優化行為中導出價格和特徵的均衡關係,才算給特徵回歸 (hedonic regression) 提供了一個嚴謹的理論基礎。後來Rosen (1979)和他的學生Roback (1982)又用類似的分析手段解釋城市特徵的隱性價格,成為城市經濟學里很有名的Rosen-Roback分析框架,被認為是整個學科的理論支柱之一(Glaeser, 2007)。Roback (1982)從空間均衡的兩個基本條件出發,假設在沒有城際遷移成本的情況下規模收益不變的廠商無論在何處都掙得零利潤、偏好相同的工人無論住在哪里都有同樣的效用,以此導出一組頗具啟發意義的結果。她的一個結論可以表示如下:
其中p*s代表消費者對城市特徵的邊際支付意願,y是房產消費量,p是單位房產價格,w是薪水水平。譬如s可以是空氣質量, dp/ds和dw/ds可以用城市水平上的回歸可能出來,y可以直接從數據中算得,三個數值合在一起,就能算出人們願意付多少錢使得空氣質量提高一點。這麼一個簡單的模型,一下子讓三個本來只有統計意義的估值有了經濟學上的含義。Chay和Greenstone (2005)利用美國空氣清潔法案造成的外生擾動,以斷點回歸的方法可能空氣質量對房價(和薪水)的影響。他們正是借助於Roback的模型結果,來理解他們得到的參數的經濟學意義。
再以我自己參與過的一項研究為例 (Brueckner et al., 2017)。我們有中國很多城市土地出讓的數據,里面有出讓前規劃的容積率限制、出讓價格、以及一些其它的相關信息。我們完全可以做這樣一個題目:容積率影響地價嗎?然後做如下的回歸分析:
γ是地價,FAR是容積率(floor-to-area ratio),是一組控制變量。我們當然可以做一些因果關係識別方面的努力,譬如把臨近的地塊歸入同一個組群並控制組群的固定效應,即通過對比組群內的地塊來降低地塊特徵缺失可能造成的可能偏誤。實際上我們確實做了這樣的回歸分析,但是在報告回歸結果之前先寫了一個模型。用S*代表沒有管制情況下開發商自定的最優容積率,Sbar代表政府規定的容積率,那麼S*/Sbar可以看作是管制嚴苛程度的指標,這個比率越高則管制得越嚴。因為現實中只有管制的情況存在,所以這個比率是無法觀察到的。我們用一個簡單的模型證明了,S*/Sbar這個比率越高,地價對容積率的彈性就越大。(這個關係很好理解,管制越嚴,放鬆一點管制對開發商的利潤影響越大,他們就願意出更高的價錢買地。)也就是說,地價對容積率的彈性也可以用來衡量管制的嚴苛程度,而依照方程(2)可能出來的系數β正是地價對容積率的彈性。如果我們不寫這個模型,β能告訴我們容積率如何影響地價,只是一個有統計學意義的系數;而有了這個模型,同樣的β就可以解釋為管制的嚴苛程度,變成一個有經濟學意義的概念了。也是因為這個模型,讓一個原本只有研究土地或研究中國的幾個小領域的學者會關心的回歸分析,變成了關於管制嚴苛程度的這樣一個有跨領域意義的題目。
作為這一節的小結,我在這里想強調幾點。
第一,雖然我在講解模型的每一個作用時用了不同的例子,這並不意味著一個模型在一篇論文里只能起到一個作用。事實上,一個模型經常在一項實證研究里起到多個作用。譬如說,一個模型完全有可能既有助於闡述一項研究的重要性,又能對回歸方程的設定起指導作用。
第二,模型越簡單越好。非結構性分析的目的不是可能模型的參數,使用模型總是為了講清某個道理,而模型的建立就必須為這個目標服務。一般來說,能用簡單的模型講清楚的道理,就不應該用複雜的模型;能用一期的、靜態的模型演示的變量關係,就不需要多期的、動態的模型;能用兩要素的生產函數演示的替代關係,就沒必要用多要素的模型。當然有時候我們需要檢查由簡化的模型導出的結果是否具有一般性,即便在這種時候,有很多學者也會選擇在論文正文中只給出簡單的模型,而把拓展部分放在附錄里,以便減輕讀者的負擔。
第三,模型不但能幫助我們加深對某些問題的理解,更能幫助我們問出截然不同的問題。對於做實證研究的學者來說,寫模型的過程就是從經濟學的視角對研究對象加深理解的過程。我們一旦開始嘗試從模型的角度思考問題,就必須直面每個相關決策者的偏好和約束,就必須去探索各種均衡條件下的結果,就必須要做到邏輯上的自洽。最終即便不需要把一個正式的模型寫進論文,這樣的思維練習也有助於增強研究的深度和嚴謹性。我曾經看到年輕同事的工作論文里對機制的討論是不符合經濟學邏輯的、甚至是自相矛盾的,這跟平時經常脫離、模型天馬行空討論問題的習慣應該是有關的。但願上面這些例子足以說明,如果我們總是做不用模型的實證研究,那麼我們所能提出的問題也是有限的。
05. 模型與結構性的實證研究
▷結構性的回歸分析
結構性的回歸分析總是要可能模型的參數,從定義上來說,這類實證研究一定會用到模型。這類研究可能的往往是「深度參數」,即那些相對穩定的、不隨環境和時間變化的、決定個人和企業行為的參數,譬如消費者效用函數里的參數、企業生產函數里的參數、消費者的時間貼現因子、風險偏好系數等等。可能這些參數,往往是為了做反事實分析(counterfactual analysis),假設一個與事實相反的狀態(某個事件發生了或沒有發生、某個政策實施了或廢止了),看看模型推測的結果是什麼樣的,與觀察到的事實做比較,從而得出事件或政策的影響。
正是因為可以做反事實分析,結構性的回歸能夠幫助我們量化尚未發生的事件或政策的影響。相對於簡化型可能,這是結構性可能的優勢之一。舉個例子來說,我們用雙重差分或者隨機實驗的辦法,可能了每一條新的公共汽車線路能減少的開私家車上班的人數。假設我們在因果識別方面做得無懈可擊,得到的參數非常有說服力,那麼再開通一條公汽線路會有何種影響,我們就比較有把握。可是如果我們要開通一條全新的地鐵線路呢?從研究已有的公汽線路的作用得到的結果能用嗎?畢竟地鐵的速度、舒適程度、停靠站頻率都跟公汽有很大差別。這種情況下就能顯示出結構性回歸的優勢了,我們用一個實例來說明。
1970年代初,舊金山地區在建設一個全新的地鐵系統(Bay Area Rapid Transit,BART)。政策制定者們自然想知道建成以後會有多少人上下班改乘地鐵。官方雇傭的咨詢機構用宏觀的通勤流量做了估算,預計BART開通之後會分流15%的上下班出行人數。加州大學伯克利分校的經濟學教授Daniel McFadden也研究了這個問題。他假設每個人有這樣一個效用函數:
一位具有個人特徵Zn的通勤人員如果選擇了具有特徵Xi的通勤模式i,那麼他的效用包括一個確定的部分X’iβ+Z’nγ和一個隨機的部分εin。這個隨機的部分可以看作是研究人員觀測不到的個人特徵和通勤方式特徵的影響。如果我們假定εin服從IID的Gumbel (type I extreme value)分布,而且每個人都追求效用最大化,那麼一個人選擇通勤方式的概率有如下的解析表達式:
這樣就可以通過最大似然法來可能效用函數的參數和。McFadden和他的助手對700多位灣區的通勤人員做了問卷調查,並用所得的數據可能出效用函數。因為每個通勤方式都被看作多個特徵的組合(包括等車時間、乘車時間、換乘次數、等等),即便還沒開通的地鐵也可以被看作這些特徵的組合,只不過有不同的特徵值而已,可以通過效用函數計算它能帶來的效用。用這樣的方法,McFadden的團隊預測將會有6.3%的通勤人員乘坐BART。地鐵開通後調查發現的實際比例是多少呢?6.2%。 方程(3)和(4)便是我們今天熟知的Logit模型,它不但一直是運輸經濟學領域常用的模型,而且被推廣到很多其它的經濟學領域(Small et al., 2005; Train, 2009)。
此後以Logit為基礎的離散選擇模型不斷發展,到1995年有三位產業組織領域的學者發表了一篇極具影響的文章,分析消費者對不同品牌汽車的選擇(Berry、Levinsohn和Pakes, 1995,通常被簡稱為BLP)。BLP假設消費者的效用是收入、汽車價格和汽車品牌特徵的函數,外加一項隨機擾動。他們延用隨機效用服從Gumbel分布的假設,本質上仍然是一個Logit模型。但是三位學者引入了一系列的新思路,包括:讓效用函數的參數隨消費者個人特徵變化;利用收縮映射(contraction mapping)的特性通過迭代運算可能不隨個人特徵變化的參數,以降低運算成本;分兩步可能函數中非線性和線性部分的參數,在線性可能部分使用工具變量解決價格受缺失特徵影響的內生性問題;在不知道個人選擇的情況下通過匹配市場份額來可能個人效用函數中的參數,從而降低了對微觀數據的要求。因為BLP的方法比較靈活,被後來的學者廣泛採用。
Bayer et al. (2007) 用BLP的方法研究舊金山地區的居民對住房的選擇。他們可能的效用函數除了包括住房特徵和價格,還包括學區質量、種族構成等鄰里特徵。這樣就可以通過可能出來的參數計算邊際替代率¾增加一單位的鄰里特徵與放棄多少收入對效用的影響能互相抵消¾從而算出居民對鄰里特徵的支付意願。為了消除鄰里特徵缺失而可能導致的偏誤,Bayer et al. 一方面採用了Black (1999)的邊界斷點方法,即通過對照學區邊界兩側的住房需求來控制缺失的鄰里特徵的影響;另一方面用3英里之外的房屋和街區特徵做房價的工具變量(因為競爭關係而影響房價,但是不直接影響效用)。
Bayer et al. (2007) 和Black (1999) 同樣都研究了居民對學區質量的支付意願,前者是結構性可能,後者是簡化型可能。對照這兩項研究能讓我們認識到兩種方法的一些優缺點。Black (1999) 用的是傳統的特徵回歸,學區質量的系數是邊際購買者的支付意願,可是如果想做成本效益分析來指導政策,我們需要的是平均支付意願,Black的估值理論上來說並不適用;而Bayer et al. 的可能因為允許參數隨個人特徵變化,就可以可能平均支付意願,對政策的指導意義更大。 同樣因為Black用的是特徵回歸,她的估值只能解釋成對微小變化的支付意願;而Bayer et al. 直接可能出了效用函數,可以用於計算對非邊際變化的支付意願。當然簡化型可能也有它的優點,主要是計算相對簡單,可以做很多敏感性和穩健性的檢驗。
Wong (2013) 用BLP的方法研究新加坡居民對住房的選擇,著重研究對街區族裔構成的偏好,把街區內各族裔的居民比例直接納入效用函數。新加坡有個種族配額制度,當一個小區某個族裔的比例達到規定的上限時,其他族裔的房主就不許把房子賣給這個族裔的居民了。Wong利用這個政策造成的需求上的「彎折」來幫助識別模型的參數。她實際上沒有個人層面的信息,只是通過電話黃頁上的姓名估算出各個小區的族裔比例,加上一些小區層面上的信息,用模擬廣義矩的方法(simulated generalized method of moments)可能出個人效用函數的參數。這也反映出BLP方法對微觀數據要求不高的特點。Wong (2013)還做了反事實分析,用估算的效用函數推算最優的族裔構成安排,然後看現實是否接近最優的安排。這也是上面提到的結構性研究的優勢。
BLP的方法也被借用來研究跨城市的居住地選擇,把城市特徵寫進效用函數。Bayer et al. (2009)利用美國國內移民走向來可能效用函數,研究人們對空氣質量的顯示性偏好。Zhang和Zheng (2015)用類似的方法研究人們對城市水平上的種族居住隔離的偏好,估算人們對降低隔離程度的支付意願。值得一提的是,此前的研究者在估算人們對城市特徵的支付意願時,一般會使用上面提到的Rosen-Roback分析框架,這個方法的前提是城際遷徙成本為零,研究美國這樣高度自由的社會里的問題也許還可以,借用到像中國這樣的有遷徙限制的社會就有點勉強了。而BLP的方法就不需要零遷徙成本的假設,甚至可以把遷徙成本寫進效用函數,直接去可能它的影響。正是因為此一方法的這個特點,Timmins (2007)用它研究了巴西的問題,Xing和Zhang (2017)、Freeman et al. (2017)用它研究了中國的問題。
最近幾年來城市和區域經濟學領域應用最廣泛的結構性分析框架,是由貿易經濟學家Eaton和Kortum (2002)首創的,今天經常被簡稱為EK模型。他們創建這個模型本來是用於分析國際貿易成本的影響。可是如果把原模型里的國家理解成一國之內的各個地區,就提供了一個分析區域經濟的框架;如果把國家看作是城市里的街區,就成了分析城市經濟的模型。前一類研究包括Donaldson和Hornbeck (2016) 關於鐵路系統對美國經濟的貢獻的論文、Donaldson (2018) 關於印度的鐵路系統對經濟的影響的論文;後一類研究包括Ahlfeldt et al. (2015) 利用柏林牆的建立和拆除造成的外生擾動來可能城市內密度經濟的論文,Tsivanidis (2018) 關於波哥大公交系統的影響的工作論文。一些學者也在用這個模型來研究中國的區域經濟問題(Tombe和Zhu, 2017;Fan, 2017)。
EK模型是個一般均衡的框架,既設定消費者偏好、生產技術,又要處理消費品和要素市場的均衡,在這里沒法給出一個完整的例子。但是有必要看一看此類模型對消費者的效用函數是如何設定的,以便能了解這類模型的一個重要特點。我這里以Ahlfeldt et al. (2015)為例,假設一個在街區居住、在街區j工作的消費者有如下的效用函數:
其中Ai是街區i的便利條件,wj是街區j的薪水水平,γi是街區i的房租水平,是兩地之間的通勤成本。Zij是隨機效用衝擊,服從Fréchet (type III extreme value)分布:
這里的Ti是住在街區i得到的平均效用水平,Ej是在街區j工作得到的平均效用水平,是個形狀參數。ϵ>1效用最大化可以導出一個人在街區i居住、在街區j工作的概率是:
就像Logit模型一樣,這里通過對隨機效用分布的假設,可以得到一個概率的解析解。當個人數量足夠多時,這些概率加總就等於在街區居住、在街區j工作的城市人口比例。因而同樣可以用最大似然法可能方程(7)里的每一個參數。跟Logit模型不同的是,這里選擇的是兩個地點的組合,而不是單個的地點。Fréchet分布是保證方程(7)解析解存在的關鍵條件,是每個EK模型里的核心假設。
上面幾個例子都是關於效用函數的結構性可能,最後再舉一個可能生產函數的例子。Epple et al. (2010) 試圖可能住房的生產函數。這個問題的難處在於住房的數量是沒法直接度量的,解決這類問題的傳統方法是把產品價值加總用來表示產品總量。可是當產品的質量千差萬別時(住房就是),這樣的度量方法容易導致巨大的偏誤。Epple et al. (2010) 從基本的微觀理論出發提出了一個方法,即先可能建築企業的利潤函數,根據包絡定理,利潤函數的一階導數是供給函數,而從供給函數可以導出生產函數。他們用匹茲堡地區的數據來演示這個方法的運用。作者們雖然沒有做反事實分析,這樣的可能結果顯然對政策評估有用。不少地方政策(譬如地產稅的變化、學區質量的提升)會影響住房需求,結合住房供給函數可以算出對房價的影響,進而推導出對本地居民福利的影響。
▷結構性的校準分析
有一些結構性的實證研究用的模型相當複雜,去可能模型中的每一個參數和變量關係已經不太現實。在這種情況下,研究人員可能去借用相關研究中得到的結果給模型參數賦值,對模型和參數值做出調整以使它模擬出的結果與現實中的一組事實大致吻合,然後用這個模型做模擬實驗、反事實分析,以回答研究者關心的問題。這樣的實證研究方法被稱作校準(calibration)分析。校準最初被大量運用於分析一般均衡框架下的宏觀經濟問題。不難想像,宏觀經濟學問題涉及的決策者和部門較多、需要考慮的參數和變量關係也更多,因而完全依靠可能來給模型賦值極其困難,這是導致校準分析最先在該領域流行起來的原因之一。而宏觀經濟學家對城市和區域經濟學問題的關注(例如Lucas和Rossi-Hansberg, 2002),自然就把這樣的分析手段引入了城市和區域經濟學。
做校準分析的實證研究一般分以下五個步驟進行(Kydland和Prescott 1996;DeJong和Dave, 2011,第六章):
(1) 提出一個需要定量解答的問題;譬如說,廢止戶籍制度對中國經濟會產生怎樣的影響?
(2) 選取一個前人檢驗過的合適的理論框架來回答這個問題;譬如說,可以用我們上面提到過的EK貿易理論框架。
(3) 建立一個模型,即由一組方程式來代表一個簡化的經濟體。
(4) 對模型進行校準,即給模型的參數賦值、選取特定的參數值組合以使模型模擬出的結果在事先選取的幾個維度上跟現實大致吻合;譬如說,使模型計算出的經濟增長率、進出口增長率、城市化率、城市規模分布變化等都跟數據里的趨勢大致相同。(跟回歸分析不同的是,校準分析在選擇參數時不以最佳擬合程度為目標。校準模型的工作更像對儀器的調整,就像我們制做一個溫度計,需要讓它在熱水開始沸騰之際顯示100度、在冷水開始結冰之際顯示零度;對模型的校準就是要讓它產生的數量關係和特徵符合已知的重要事實。)
(5) 用經過校準的模型做實驗來回答步驟(1)里提出的問題,譬如說把模型中戶籍制度的限制全部消除,看重新解出的宏觀經濟變量與廢除限制之前有哪些變化;這樣的練習不但能量化取消戶籍制度對每一個宏觀變量的影響,還能幫助研究者搞清楚這些影響是通過哪些管道達成的。
Albouy (2009)就是使用校準分析的一個例子。作者要研究的問題是,美國的聯邦所得稅率對全國各地的居民是一致的,但是因為城市地區需要高收入來抵消高房價等高生活成本,導致城市地區的居民在累進稅制的情況下稅負更重。那麼這種地區間的稅負不平等的影響是什麼呢?Albouy把收入所得稅引入傳統的Rosen-Roback理論框架,建立了一個一般均衡模型,對模型進行校準,然後用這個模型進行模擬實驗。他發現,稅負的不同導致高薪水地區的長期就業水平被壓低了13%,地價和房價被分別壓低了21%和5%,由此而導致的經濟損失占國民收入的0.23%。
Desmet et al. (2018) 研究未來世界經濟發展的地理分布。他們將Allen和Arkolakis (2014)、 Eaton和Kortum (2002)以及Kline和Moretti (2014)等幾個理論框架的特點結合起來構建一個一般均衡模型,用來分析地球上每個1經度´1緯度(在赤道附近大致等於111公里´111公里)的方格里的經濟活動。他們對這個模型進行校準,通過該模型反推回去的人口分布與全球過去一百多年的人口分布和增長擬合較好。他們用這個模型來分析,如果世界範圍內降低(國內的和跨國的)遷徙限制結果會怎樣。他們發現,如果完全消除移民限制,全世界的福利會增長三倍,70%的人口會選擇跨國移民。這樣世界大同的極端情況當然不太可能做到,但是確實說明了對人力資本流動的限制影響何其大。他們也分析了部分地降低移民限制的影響以及不同地區所受影響的差異程度。
需要指出的是,即便是以校準分析為主體的實證研究,也經常用到各種回歸方法。大致有以下三種情形:
(1)有些研究會先借助回歸分析描述一些「典型事實」(stylized facts),然後以這些事實為指導建立模型,再針對模型做校準分析。譬如Felkner和Townsend (2011)關於泰國企業地理分布的研究,就先做回歸來展示離市場和基礎設施越近的地方企業數量越多、自然條件越好的地方企業數量越多等等,而後構建和校準模型的目標之一就是能說明這些事實。再比如Ngai和Tenreyro (2014)在研究住房市場的季節性變化時,先做回歸顯示春夏兩季搬進新居的人家住的時間更久、翻修花費更低,表明春夏兩季買到手的住房更合意,然後根據這些事實建了一個搜尋匹配模型做校準分析。
(2)有很多研究在做校準分析時,用的一些參數值是研究者自己通過回歸分析得到的。例如Albouy (2009) 在校準分析中採用的美國各城市薪水水平,就是他自己通過回歸分析可能的。Xu (2018)校準一個經過拓展的EK模型,分析中國高鐵系統的福利效應,他用到的國內遷徙和貿易成本都是自己可能的。
(3)有些研究者在建立一個模型之後,先做回歸分析來驗證模型的某些推斷,然後再做校準分析來回答所關心的問題。Rossi-Hansberg et al. (2010)關於住房外部效應的研究就是這樣的,他們先建立一個模型來解釋政府資助的城市改造項目的影響,然後用里士滿的數據做非參數回歸、顯示城市改造項目對地價的影響隨距離遞減,最後做校準分析算出住房外部效應隨距離遞減的速率並計算城市改造項目的收益率。Gennaioli et al. (2013) 研究影響區域發展的因素,也是先根據模型的推斷做回歸分析、發現人力資本在解釋區域收入差異時至關重要,然後再做校準分析,計算工人的教育水平、企業家的教育水平、人力資本外部性在解釋區域間勞力生產率差異時各自起的作用。
▷結構性實證研究的優缺點
在結束這一小節之前,我仍然要做幾點評論。在談具體例子的時候,我已經提到一些結構性研究的優缺點,這里算是幾點補充。
第一,有一種看法認為結構性研究的假設太多,不像簡化型可能那樣乾淨。這當然與結構性研究用到的模型相對更複雜有關。值得一提的是,所說的結構性研究假設太多在很大程度上只是一個錯覺。任何一個試圖解釋現象或建立因果關係的實證研究,必然以一系列的假設為起點。舉個例子來說,如果你的研究目的只是想說明廈門的住房均價比成都高,那你對比兩個樣本均值就行了,不用做太多的假設。可是一旦你想說明為什麼廈門的房價更高,你必然要做一連串的假設。也就是說,即便是非結構性的研究,只要作者不是做簡單的描述,一定也是建立在層層假設之上的。如果說結構性研究和非結構性研究在這一點上真有區別的話,那只是結構性研究因為有模型的約束必須在每一步盡量把假設講清楚,而非結構性研究(特別是那些脫離模型的)往往做了很多隱含的假設。從科學研究的角度來說,寫明所做的假設是個好習慣。
第二,另有一種觀點認為,簡化型研究在因果識別方面做得比結構性研究更好。這一點可以商榷。應該承認,強調因果關係的識別、要求研究者講明外生擾動來源這樣的標準做法,最早是由做簡化型研究的學者大力推行的,而好的簡化型研究確實在這一方面值得稱讚和效仿。可是講明外生擾動來源其實是每個做實證研究的學者都應該特別注意的,而最近這些年來做結構性研究的學者也已經接納了這個標準。可以說,好的結構性研究在因果識別策略方面所下的功夫並不比好的簡化型研究遜色。譬如前面提到的Ahlfeldt et al. (2015)利用柏林牆的起落、Wong (2013)利用新加坡的族裔配額、Bayer et al. (2007) 利用學區邊界斷點,都是很精彩的識別策略。
第三,簡化型研究跟結構性研究比起來,因為計算量較小而更容易做穩健性、敏感性的檢驗。這是個不爭的事實。自從Leamer (1983)倡導系統化的穩健性檢驗,實證經濟學家在實踐中應該說有了一些進步,現在很多微觀實證研究會有專門的一節報告穩健性檢驗的結果。可是結構性研究在這方面還亟待提高。因為參數較多、計算繁復,很多結構性研究在挑戰計算技術的極限,難以進行全面的穩健性分析,給人一個黑匣子的感覺、不知道計算結果對一些參數值有多麼敏感。希望將來在計算技術繼續提高的情況下,結構性研究能夠進一步克服這方面的問題。
第四,因為與經濟理論聯繫緊密、環環相扣,結構性的研究在一些學者看來更有趣。 何為有趣,當然屬於主觀判斷。但是也無法否認,有些研究的特點確實對學者具有更大的吸引力,譬如簡潔的模型、意料之外而又在情理之中的結果、巧妙的計量方法設計等等,都是學者們普遍接受的好的研究所具有的特性。結構性的研究把經濟學理論和統計分析有機地結合在一起,確實是一個較好的做法。譬如McFadden用一個並不很牽強的關於隨機效用分布的假設,把效用最大化、最大似然法、邊際替代率等經濟學和統計學概念揉成一個整體,回答人們關心的實際問題,給人一種賞心悅目的感覺。
第五,結構性的方法能讓我們提出不一樣的問題、回答不同的問題。拋棄了模型,就等於拋棄了這一類問題。再以Au和Henderson (2005)為例,他們問中國的城市是不是太小了。我想沒有人會否認這是一個極其重要的問題,關於這個問題的討論從來沒有停息,而對這個問題的回答關乎中國城市化道路的選擇。同時我想受過嚴格訓練的學者里也不會有人否認,這個問題不依靠模型是沒法解答的。我們必須要搞清最優的城市規模是什麼,然後與現實做對比,才能回答這個問題。也就是說,只有做結構性的可能才能回答這一類的問題。上面提到的,量化廢止戶籍制度的影響,也屬於這類問題 (Bosker et al., 2012)。
06. 總結
回到開篇時提到的現象,我感覺很多城市和區域經濟學領域的年輕華人學者都在做不用經濟學模型的研究。我們經濟學家知道分工的重要性,從個人的角度來看,如果覺得寫模型不是自己的比較優勢,從而致力於脫離模型的實證研究,似乎也是有道理的選擇。可是如果一個群體都做這樣的選擇,就不正常了。我希望上面的這些例子能夠表明,脫離正規理論模型會影響實證研究的深度、會限制我們選題的廣度,把一大堆重要的問題排除在我們的研究之外。打個比方說,模型是我們經濟學者探索未知世界的重要工具之一,放棄了這個工具就如同木工只留下了錘子而扔掉了改錐,手里的工具決定了我們只能看到釘子的用途而看不到螺絲釘的用途;更糟糕的是,我們可能由於手里工具的限制,去用錘子敲打螺絲釘。一個真正的學者,必然因問題的不同而選擇最合適的解決方法(合適的工具)。如果能把各類研究方法的優勢結合起來,就更好了。
我們華人經濟學者,特別是研究中國問題的華人經濟學者,大多有一個想法,就是通過自己的研究來理解中國的高速發展。我們時常說,用我們的研究講好「中國的故事」。在經濟學說史上有頗多建樹的George Stigler (1960) 有個觀點,他認為經濟科學的重大發展,主要是由學科內的邏輯運行機制推動的,現實世界的具體事件起的作用有限。中國的高速發展無疑是幾十年來經濟領域最重要的現象之一,這也是我們很多華人學者做研究的動力之一。可是按Stigler的說法,研究了身邊重要的現象並不必然是重要的研究;只有在研究這個現象時推動了學科的發展,才能成為重要的貢獻。換句話說,只有把「中國的故事」講成「經濟學的故事」,以中國的經驗推動學科內知識的積累和方法的創新,才有可能做出有影響的學術貢獻。在我看來,以模型為依托的實證研究,是從「中國的故事」里提煉經濟學時不可或缺的一項工作。
註:文章轉載自中國經濟學教育科研網,版權歸原作者所有,本文僅作學術分享。
今日推薦公號
☟
學術志
原「學術中國」公號
這里有各種論文寫作經驗指導
各專業書單匯總
各高校熱點及發展史追蹤等等
高校教師、碩博研究生、大學生都會關注的公號
☟
☟
掃碼關注可查看更多學術文章
☟