نام‌ها حاوی اطلاعات اقتصادی و اجتماعی هستند

البرز نظامی

یک پیشنهاد برای دور زدن کمبود داده‌های پنل

چگونه می‌توان به فهم رویدادها پرداخت؟ به بیانی ساده‌‌تر، چگونه می‌توان به پاسخ پرسش‌های خود رسید؟ طرح این پرسش و کوشش برای دستیابی به پاسخ آن، سرآغاز علم است. شاید بتوان با کمی اغماض بیان کرد که در حوزه علوم طبیعی مانند فیزیک، پاسخ این پرسش را دهه‌ها یا حتی قرن‌ها پیش اهل علم ارائه کرده‌اند؛ اما داستان در حوزه‌های علوم انسانی و اجتماعی مانند اقتصاد همچنان ادامه دارد. بحث بر سر روش مطالعه رویدادها در علم اقتصاد همچنان پابرجاست؛ بحثی که تفاوت اصلی علمی چون اقتصاد را با علوم طبیعی نشان می‌دهد. بحثی که سرآغاز مکتب‌های فکری متفاوت در علم اقتصاد می‌شود و به دنبال خود، تفسیرها و تجویزهای مختلف اهالی علم اقتصاد را در مواجهه با رویدادهای یکسان دربردارد. ما در این یادداشت بنا نداریم که وارد جدل اندیشه‌های اقتصادی شویم. ما با مبنا قرار دادن جریان اصلی علم اقتصاد، تنها به ذکر این نکته می‌پردازیم که روش مواجهه «جریان اصلی علم اقتصاد» با رویدادها و راه این علم برای یافتن پاسخ پرسش‌‌های خود تنها یک مسیر است و آن مسیر چیزی نیست جز جمع‌آوری داده‌ها و تحلیل آنها به کمک علم آمار.

این روش جریان اصلی علم اقتصاد همان چیزی است که اقتصاددان‌ها و اقتصادخوان‌ها از آن با عنوان اقتصادسنجی یاد می‌کنند. اقتصادسنجی در واقع استفاده از علم آمار برای جمع‌آوری و تحلیل داده‌ها است. این روش که در ظاهر رنگ‌وبوی ایدئولوژیک ندارد، در باطن خود، بر پایه یک فهم کم‌وبیش ایدئولوژیک شکل گرفته‌است؛ اینکه جهان حاوی یک نظم پیوسته است. به بیانی دیگر، در جهانی که ما در آن زندگی می‌کنیم، نوعی امر کلی وجود دارد که راه کشف آن، مطالعه پیوسته و مکرر امور جزئی است. ما آن‌قدر باید به مطالعه امور جزئی بپردازیم تا شاید روزی بتوانیم به کشف امر کلی نائل شویم. به این ترتیب، امر جزئی در این روش حائز اهمیت ویژه می‌شود. آن‌چنان‌که هر امر جزئی توان آن را دارد تا هر نوع تلقی از امر کلی را زیر سوال ببرد. لکن، در این میان یک مشکل جدی وجود دارد.

در واقع، جدای از نقدهای گاه کوبنده مخالفان اقتصادسنجی به این روش جریان اصلی علم اقتصاد، این روش از یک مشکل اساسی که خود نیز به آن معترف است، رنج می‌برد. این مشکل از این قرار است که مطابق این روش، ابتدا باید داده‌ای باشد تا سپس امر تحلیل داده‌ها آغاز شود. واقعیت آن است که وجود داشتن داده‌ها یا دسترسی به آنها همواره ممکن نیست. به‌عنوان یک مثال ساده، ما برای تحلیل روندهای اقتصادی ایران در دوران قاجار یا به کل داده موثقی نداریم یا با کمبود داده مواجه هستیم. این مشکل کمبود داده یا نبود آن، گاه به زمان‌های حاضر هم می‌رسد. اساسا یکی از مشکلات کشورهای در حال توسعه کمبود داده یا عدم دسترسی به داده‌های موجود است. به این ترتیب، در اینجا یک پرسش مهم به وجود می‌آید؛ زمانی که ما به داده‌ها دسترسی نداریم، چه باید بکنیم؟ آیا اینجا پایان اقتصادسنجی و روش جریان اصلی علم اقتصاد است؟ پاسخ سنجی‌کاران به این پرسش، یک « نه» قاطع است.

به‌عنوان مثال، یکی از نیازهای جدی سنجی‌کاران برای تحلیل روندهای اقتصادی، داده‌هایی هستند به نام داده‌های پنل یا همان Panel Data. با حضور این داده‌ها، سنجی‌کارها می‌توانند وضعیت افراد معینی (شرکت، شهر و هر واحد دیگر) را در طول زمان رصد کنند و به این ترتیب، تغییر وضعیت آنها را متناسب با تغییر متغیر مورد نظر خودشان را رصد و نتایج قابل استناد و بدون سوگیری را استنتاج کنند. لکن، یکی از بزرگ‌ترین مشکلات موجود در کشورهای در حال توسعه نبود این داده‌های پنل است. درست به همین دلیل، اهالی علم اقتصاد در کشورهای در حال توسعه با بن‌بست‌های مطالعاتی مواجه می‌شوند. حال برای حل این مشکل چه باید کرد؟ باید پرسش را رها کرد و منتظر ماند تا داده‌های پنل برای سوال فراهم شود یا نه؛ می‌توان با انجام یکسری حرکات هوشمندانه، نوعی ارتباط خلق کرد. همان چیزی که سنجی‌کاران از آن با عنوان Pseudo Panel یا نوعی «شبه ارتباط» یاد می‌کنند. عملی که منجی اقتصاددانان در زمان کمبود داده‌ها می‌شود و کمک می‌کند تا پاسخ‌های هر چند نادقیق؛ اما، کارآمد را برای پرسش‌های خود ارائه کنند. یادداشت امروز ما بنا دارد تا به معرفی یکی از همین راه‌های برقراری شبه‌ارتباطات در زمان نبود داده‌های پنل بپردازد؛ راهکاری که می‌تواند به محققان کشور کمک بسیاری برای پیگیری پاسخ پرسش‌های خودشان کند.

یک خلاقیت شگفت‌انگیز

کلودیا اولیوتی و دانیل پاسرمن دو اقتصاددان معروف در حوزه نیروی کار، در سال2015 میلادی مقاله‌ای با عنوان «تحرک بین‌نسلی در ایالات متحده آمریکا از سال 1850 تا 1940» (Intergenerational Mobility in the United States, 1850–1940) را منتشر کردند که در آن به دنبال محاسبه میزان کشش درآمدی بین‌نسلی میان پدران و فرزندان در آمریکای سال‌های 1850 تا 1940 بودند. آنها برای انجام این کار با یک مشکل مهم مواجه بودند؛ این مشکل نیز چیزی نبود جز کمبود داده‌های پنل. آنها بر اساس داده‌های موجود برای برقراری ارتباط دقیق میان پدران و فرزندان ناتوان بودند. این مشکل درخصوص دختران شکل ویژه‌تری به خود می‌گرفت؛ زیرا با تغییر نام خانوادگی دختران پس از ازدواج، به‌طور کامل ارتباط میان پدران و دختران در سرشماری‌های جمعیتی از بین می‌رفت و در نتیجه، ردگیری افراد با بن‌بست مواجه می‌شد.

بنابراین، تخمین کشش‌های بین‌نسلی و به دنبال آن برآورد میزان تحرک بین‌نسلی یا همان جابه‌جایی طبقاتی برای آمریکای 1850 تا 1940 با مشکل کمبود داده‌های پنل مواجه شده ‌بود. آنها برای حل مشکل دست به دامان «شبه‌ارتباط‌ها» شدند. درواقع، همان‌طور که سنجی‌کاران بیان می‌کنند، زمانی که ما با کمبود داده‌های پنل مواجه هستیم، می‌توانیم از مدل شبه‌پنل یا همان Pseudo Panel استفاده کنیم. منطق این روش از این قرار است که ما چون به تک‌تک افراد و رصد کردن آنها در طول زمان دسترسی نداریم، واحد مطالعاتی خود را از افراد به گروه یا همان cohort تغییر می‌دهیم. درواقع، در اینجا ما باید هنر خلق گروه یا cohort داشته باشیم. ما باید گروه‌های خودمان را طوری طراحی کنیم که افراد موجود در هر گروه تقریبا یکسان به نظر برسند. در این حالت، دیگر ما به دنبال رصد کردن افراد در طول زمان نیستیم، بلکه به دنبال رصد کردن گروه‌ها در طول زمان هستیم. گروه‌هایی که افراد داخل آن گویی آنقدر مشابه یکدیگرند که همگی یکسان تلقی می‌شوند.

همان‌طور که متوجه شدید، خلق یا کشف این گروه‌ها نوعی هنر است. کاری سخت که باید بتواند نقش نمایندگی خود را به خوبی اجرا کند. حال وقت آن رسیده ‌است که از هنر اولیوتی و پاسرمن در مقاله مذکورشان رونمایی کنیم. آنها برای تشکیل گروه‌بندی‌های خود از یک فرض کلیدی استفاده کردند. فرض کلیدی آنها از این قرار بود که اسم‌های کوچک افراد، چه پسران و چه دختران، حاوی اطلاعات کلیدی درخصوص وضعیت اقتصادی و اجتماعی آنها است. به بیان دیگر، آنها بیان کردند که هر اسمی نشان‌دهنده طبقه اقتصادی-اجتماعی آن فرد است. به‌عنوان مثال، اگر اسم پسری ادوارد و اسم دختری ماریان باشد، آنها احتمالا از طبقه اقتصادی بالای جامعه هستند و پدران ثروتمندی دارند. همچنین اگر اسم پسری چارلی و اسم دختری نانسی باشد، آنها احتمالا از طبقه اقتصادی پایین جامعه هستند و پدران فقیری دارند.

بنابراین، این دو اقتصاددان با این فرض گروه‌ها یا همان cohortهای خود را بر مبنای اسم‌های کوچک موجود در سرشماری‌ها ساختند. آنها فرض کردند که افراد هر گروه که اسم کوچک یکسانی دارند، به یک وضعیت اقتصادی-اجتماعی خاصی تعلق دارند. حال اینکه آنها در ادامه این مقاله چگونه با این روش توانستند موفق به برآورد کشش‌های بین‌نسلی در آمریکا شوند، مساله یادداشت ما نیست، مساله یادداشت ما این است که آیا این فرض کلیدی درست است و ما از این طریق می‌توانیم برای خود گروه‌ها یا cohort‌هایی بسازیم یا خیر؟ زیرا اگر این فرض درست باشد، ما یک راه خلاقانه برای دور زدن کمبود داده‌های پنل و خلق Pseudo Panel‌ها به‌دست آورده‌ایم.اولیوتی و پاسرمن برای انجام این کار یک معادله رگرسیون ساده زدند. آنها با تشکیل یکسری Dummy Variableها مبتنی بر اسامی فرزندان، درآمد پدران را بر نام فرزندان رگرس کردند. نتیجه، تایید فرضیه آنها بود. به بیان ساده‌تر، آنها به بررسی این مساله پرداختند که با تغییر نام کوچک فرزندان، آیا میزان درآمد پدران تغییر پیدا می‌کند یا خیر؟ نتیجه، از این قرار بود که با تغییر نام کوچک فرزندان، میزان درآمد پدران تغییر پیدا می‌کرد. همان‌طور که در ستون هشت جدول شماره1 مشاهده می‌کنید، تغییر نام کوچک فرزندان، در پسران 11 تا 13درصد از تغییر درآمد پدران را توضیح می‌دهد. همچنین، تغییر نام کوچک فرزندان در دختران نیز 13 تا 17درصد تغییر درآمد پدران را توضیح می‌دهد. این درصد‌ها که در واقع به قول سنجی‌کاران میزان R2 مدل را نشان می‌دهد، شاید آن‌چنان زیاد نباشد؛ اما نشان می‌دهد که مدل آنها معنادار است و فرض آنها را مبنی بر اینکه اسامی کوچک نشانگر وضعیت طبقه اقتصادی-اجتماعی افراد است، تایید می‌کند.البته، بدیهی است که این میزان توضیح‌دهندگی مدل کم است. لکن، دست‌کم یک ادعای آنها درست است. همان‌طور که در جدول شماره2 مشاهده می‌کنید، ما برای پسران و دختران، 5نام پرکاربرد را هم برای طبقات بالای جامعه و هم برای طبقات پایین جامعه از دهه1850 تا دهه1920 را فهرست کرده‌ایم. همان‌طور که برخی اسامی با رنگ خاکستری روشن (طبقات مرفه) و خاکستری تیره (طبقات فرودست) نشان‌گذاری شده‌اند، به ما بیان می‌کنند که اسامی پرطرفدار چه در طبقات بالای اقتصادی و چه در طبقات پایین اقتصادی، در طول هفت دهه از نوعی تکرار و تداوم برخوردار بودند. به دیگر سخن، این مساله نشان می‌دهد که اسامی کوچک افراد دارای توزیع تصادفی نیستند. در نتیجه، این عدم توزیع تصادفی نشانگر وجود نوعی اطلاعات کلیدی در باطن این اسم‌ها است.

جمع‌بندی

آنچه ما از مقاله اولیوتی و پاسرمن یاد گرفتیم، از این قرار بود که زمانی که به داده‌های پنل دسترسی نداریم، برای ساخت گروه‌های لازم برای مدل Pseudo Panel خود برای دور زدن محدودیت داده‌ها، می‌توان از اسامی کوچک افراد استفاده کرد. اسامی کوچک با عدم توزیع تصادفی مواجه هستند و می‌توانند با تغییر خود، 11 تا 17درصد از تغییر درآمد پدران را توضیح دهند. در نتیجه، اسامی کوچک حاوی اطلاعاتی درخصوص وضعیت اقتصادی-اجتماعی افراد هستند. بنابراین، این فرض شاید به اقتصاددانان کشور ما نیز برای دور زدن محدودیت داده‌های پنل کمک کند.

نام‌ها حاوی اطلاعات اقتصادی و اجتماعی هستند

نام‌ها حاوی اطلاعات اقتصادی و اجتماعی هستند

یک پیشنهاد برای دور زدن کمبود داده‌های پنل

یک خلاقیت شگفت‌انگیز

جمع‌بندی

* منبع جدول‌ها : مقاله «تحرک بین‌نسلی در ایالات متحده آمریکا از سال 1850 تا 1940» از کلودیا اولیوتی و دانیل پاسرمن.

Report Page