Панельные данные[1][2], или лонгитюдные данные[2] — используемые в социальных науках и эконометрике многомерные данные, получаемые серией измерений или наблюдений за несколько периодов времени для одних и тех же компаний или людей. Исследование, в котором используются панельные данные, называется панельным исследованием.
Пример
Сбалансированная панель
Человек
Год
Доход
Возраст
Пол
№ 1
2016
1300
27
1
№ 1
2017
1600
28
1
№ 1
2018
2000
29
1
№ 2
2016
2000
38
2
№ 2
2017
2300
39
2
№ 2
2018
2400
40
2
Несбалансированная панель
Человек
Год
Доход
Возраст
Пол
№ 1
2016
1600
23
1
№ 1
2017
1500
24
1
№ 2
2016
1900
41
2
№ 2
2017
2000
42
2
№ 2
2018
2100
43
2
№ 3
2017
3300
34
1
В приведенном примере показаны два набора данных, собранные в панельную структуру. Индивидуальные характеристики (доход, возраст, пол) собираются для разных людей и разных лет. В первом наборе данных два человека (№ 1, № 2) наблюдаются каждый год в течение трех лет (2016, 2017, 2018). Во втором наборе данных три человека (№ 1, № 2, № 3) наблюдаются два раза (человек № 1), три раза (человек № 2) и один раз (человек № 3), соответственно, за три года (2016, 2017, 2018); в частности, для человека № 1 отсутствуют данные по 2018 году, а для человек № 3 — по 2016 и 2018 году.
Сбалансированная панель[3] (первый пример) представляет собой набор данных, в котором каждый член группы (то есть человек) наблюдается каждый год. Следовательно, если сбалансированная панель содержит N единиц наблюдения и Т периодов, число наблюдений (n) в наборе данных обязательно составит п = N × T[4].
Несбалансированная панель[3] (второй набор данных в примере) представляет собой набор данных, в котором, по меньшей мере, один член группы не имеет данных по всем периодам. Поэтому, если несбалансированная панель содержит N единиц наблюдения и Т периодов, то число наблюдений (n) в наборе данных строго меньше их произведения: п < N × T[4].
Оба набора данных структурированы в длинном формате, в котором одна строка содержит одно наблюдение за один раз. Другим способом структурирования панельных данных является широкий формат, где одна строка представляет одну единицу наблюдения для всех моментов времени[5] (например, в широком формате будет только две (первый пример) или три (второй пример) строки данных, с дополнительными столбцами для каждой переменной времени (доход, возраст).
↑ 12Денисова И. А. Выход старших возрастных когорт с рынка труда: анализ методами дожития // Население и экономика.. — 2017. — Т. 1, № 1. — С. 22-49.
↑ 12Грин У. Г. Эконометрический анализ / перевод с английского под научной редакцией С. С. Синельникова и М. Ю. Турунцевой. — Москва: Издательский дом «Дело» РАНХиГС, 2016. — Т. 1. — С. 423. — 760 с.
↑ 12Panel Data Econometrics: Theory (англ.) / edited by Tsionas M.. — Academic Press (an imprint of Elsevier), 2019. — P. 348. — 432 p.
↑Andreß H.-J., Golsch K., Schmidt A. W. Applied Panel Data Analysis for Economic and Social Surveys (англ.). — Springer Science & Business Media, 2013. — P. 28. — 327 p.
Литература
Baltagi, Badi H. (2008). Econometric Analysis of Panel Data (Fourth ed.). Chichester: John Wiley & Sons. ISBN 978-0-470-51886-1.
Davies, A.; Lahiri, K. (1995). A New Framework for Testing Rationality and Measuring Aggregate Shocks Using Panel Data // Journal of Econometrics. 68 (1): 205–227. doi:10.1016/0304-4076(94)01649-K.
Davies, A.; Lahiri, K. (2000). "Re-examining the Rational Expectations Hypothesis Using Panel Data on Multi-Period Forecasts". Analysis of Panels and Limited Dependent Variable Models. Cambridge: Cambridge University Press. pp. 226–254. ISBN 0-521-63169-6.
Diggle, Peter J.; Heagerty, Patrick; Liang, Kung-Yee; Zeger, Scott L. (2002). Analysis of Longitudinal Data (2nd ed.). Oxford University Press. p. 2. ISBN 0-19-852484-6.
Frees, E. (2004). Longitudinal and Panel Data: Analysis and Applications in the Social Sciences. New York: Cambridge University Press. ISBN 0-521-82828-7.
Hsiao, Cheng (2003). Analysis of Panel Data (Second ed.). New York: Cambridge University Press. ISBN 0-521-52271-4.
Fitzmaurice, Garrett M.; Laird, Nan M.; Ware, James H. (2004). Applied Longitudinal Analysis. Hoboken: John Wiley & Sons. p. 2. ISBN 0-471-21487-6.
В другом языковом разделе есть более полная статья Panel data (англ.).