نوع مقاله : مقاله پژوهشی
نویسندگان
1 استادیار گروه مهندسی کامپیوتر، دانشکده مهندسی، دانشگاه بزرگمهر قائنات، قائنات، ایران (نویسنده مسئول)؛
2 استادیار، پژوهشگاه ارتباطات و فناوری اطلاعات، تهران، ایران؛
چکیده
کلیدواژهها
موضوعات
عنوان مقاله [English]
نویسندگان [English]
Participatory governance and collaboration between the government and the public lead to access to human resources and citizen ideas, more informed decision-making, reduced corruption and budget waste, and so on, resulting in the emergence of a democratic government. Participatory governance occurs when both government organizations provide their data to citizens and citizens use the provided data to generate ideas and create value. Given this necessity, the aim of this research is to examine methods for increasing the participation of government organizations in providing open data, meaning data that is freely and openly available to the public, as well as examining methods for increasing citizen participation in using the data. To this end, library studies were used to extract influential criteria for increasing citizens' willingness to use data and to identify factors and incentives for encouraging government organizations to provide data openly. Subsequently, all government organizations and institutions present in the national catalog and open and applicable data system that provide data openly were examined, and the status of each organization was extracted and specified based on each criterion. Given that the number of government organizations providing open data in this system was 112, it constituted the entire statistical population, and sampling was not used. Then, using data mining methods, the characteristics of the data from organizations that were more preferred and used by citizens were identified. Additionally, using field methods and multi-criteria decision-making techniques, the weight and importance of the influential factors in the participation of organizations in providing data openly were calculated. After library studies, the criteria of "data authenticity", "license openness", "up-to-dateness", "data accessibility", "metadata completeness", "number of datasets", "format openness", "non-discrimination", "understandability", "number of data categories", "free availability", "absence of missing data", "possibility of data requests", "visualization", "feedback capability", and "data set subject" were extracted as comprehensive influential criteria for increasing citizens' willingness to use data. Based on the results obtained, the criterion "community subject" with a coefficient of 72.564 and a positive sign had the greatest impact on increasing citizens' visits to open government data. Following that, the criterion "format openness" with a coefficient of 52.682 and a positive sign ranked second in increasing visit rates. Additionally, based on library studies, six factors—"need to comply with higher authorities", "reduction of operational sensitivity of the organization", "need for financial resources", "need for transparency", "need for human resources" and "need for information technology resources"—were identified as influential factors in the participation of government organizations in providing data openly. The findings of this research can assist managers in making informed decisions and effective management to improve participatory and public governance, thereby benefiting from its advantages.
کلیدواژهها [English]
مقدمه
حکمرانی مشارکتی بر مشارکت عمیق و دمکراتیک با مشارکت شهروندان تمرکز دارد و ایده پشتیبان آن این است که شهروندان باید نقش مستقیمتری را در تصمیمات عمومی داشته باشند، یا حداقل در مسائل سیاسی عمیقتر دخیل شوند. در عمل، این نوع حکمرانی میتواند مکمل نقش شهروندان، بهعنوان رأیدهنده و ناظر کارکردهای دولت باشد (Fu, 2019؛ ژاله باغبادرانی، یعقوبیپور و فتحیزاده، 1400). همکاری بین حکومت و شهروندان، سبب دستیابی به منابع انسانی و ایدههای شهروندان، تصمیمگیریهای آگاهانهتر، کاهش فساد و هدررفت بودجه و غیره میشود و درنتیجه ایجاد یک حکومت مردمسالار را در پی خواهد داشت که این موضوع، اهمیت توجه به مسئله حکمرانی مشارکتی را بیان میکند (امامجمعهزاده، 1395). برای مثال، زمانی که دولت، اطلاعات مربوط به نحوه و میزان تخصیص بودجه به نهادهای مختلف را در اختیار شهروندان قرار دهد، شهروندان میتوانند بر آن نظارت کرده و از هدررفت بودجه و فساد جلوگیری کنند. همچنین، آنها میتوانند ایدههای خود را در این خصوص بیان کنند. در وضعیت کنونی کشور، سازمانهای دولتی دادههای کمی به شهروندان ارائه دادهاند که این تعداد از مجموعه دادهها مناسب نیست و اغلب مشکلات عدم بهروز بودن، عدم فراداده، عدم قابل خواندن ماشین و غیره را داراست. درواقع میتوان گفت این مشکلات نشان میدهد که سازمانها به ارائه دادههای خود به شهروندان تمایلی ندارند. همچنین، بررسی میزان بازدیدها از دادههایی که در دسترس عموم قرار گرفتهاند، نشان میدهد شهروندان نیز تمایل کمی به استفاده از این دادهها دارند. این مشکل میتواند به دلایل مختلفی مانند موضوع مجموعه دادهها و غیره باشد. وضعیت مطلوب زمانی رخ میدهد که هم سازمانها به ارائه دادههای خود به شهروندان بپردازند و هم شهروندان در استفاده از دادهها، تمایل نشان دهند. ازاینرو بهمنظور تحقق حکمرانی مشارکتی و دستیابی به مزایای ذکر شده آن، افزایش تمایل سازمانها در ارائه دادهها و همچنین افزایش تمایل شهروندان در استفاده از دادهها، ضروری است.
با توجه به ضرورت بیان شده، هدف این پژوهش بررسی روشهای افزایش مشارکت سازمانهای دولتی در ارائه دادههای باز[1] یعنی دادههایی که آزاد و رایگان در اختیار مردم قرار گرفتهاند (Enders, Benz and Satzger, 2021) و همچنین بررسی روشهای افزایش مشارکت مردم در استفاده از دادهها است. بدینمنظور، در فاز اول، به استخراج معیارهای مؤثر در افزایش تعامل و استفاده شهروندان از دادهها براساس مطالعات کتابخانهای پرداخته شده است. جامعه آماری شامل همه مقالات مرتبط با معیارهای مؤثر در تمایل شهروندان در استفاده از دادههای باز بوده است. از روش نمونهگیری احتمالی از نوع نمونههای تصادفی ساده استفاده شده و 15 مقاله در این حوزه بررسی شده است. سپس همه سازمانها و مؤسسههای دولتی حاضر در سامانه ملی کاتالوگ و مجموعه دادههای باز و کاربردی که به ارائه دادهها بهصورت باز میپردازند مورد بررسی قرار گرفته است و وضعیت هر سازمان با توجه به هر معیار که از مطالعات کتابخانهای بهدست آمده، مشخص شده است. با توجه به اینکه تعداد سازمانهای دولتی ارائهدهنده دادههای باز در این سامانه 112 مورد بوده همه اعضای جامع آماری را شامل شده و مورد بررسی قرار گرفته است. سپس، با استفاده از روشهای دادهکاوی، ویژگیهای دادههای سازمانهای با وضعیت مطلوب، مشخص شده است. در فاز دوم، به استخراج عوامل و محرکهای ترغیبکننده سازمانها در ارائه دادهها بهصورت باز براساس مطالعات کتابخانهای پرداخته شده است. همچنین با استفاده از روش میدانی و تکنیکهای تصمیمگیری چندمعیاره،[2] وزن و اهمیت هر معیار محاسبه شده است.
ازاینرو پژوهشهای مرتبط، معایب و محدودیتهای آنها و دلایل پرداختن به پژوهش جاری ارائه شده است. همچنین در ادامه روش پژوهش مطرح شده که شامل فازهای نحوه افزایش مشارکت شهروندان در استفاده از دادههای دولتی باز و عوامل و محرکهای ترغیبکننده سازمانهای دولتی در ارائه دادهها بهصورت باز، بیان شده است. سپس به نتایج و بحث درخصوص یافتهها پرداخته شده و درنهایت در بخش پایانی به نتیجهگیری مطالب گفته شده میپردازد.
۱. پیشینه پژوهش
در این بخش به پژوهشهای مرتبط با عوامل و محرکها در افزایش مشارکت سازمانها و شهروندان در ارائه و استفاده از دادههای دولتی باز پرداخته شده است. جدول 1، پژوهشهای مرتبط را براساس نام پژوهشگران، سال انتشار، عنوان پژوهش، شرح مختصر و نتایج نشان میدهد.
جدول 1. پژوهشهای پیشین، شرح مختصر و نتایج
نتایج |
شرح مختصر |
سال انتشار |
نام پژوهشگران |
عنوان پژوهش |
براساس نتایج این پژوهش، عدم تعامل بین کاربران با پورتالهای دادههای دولتی باز در مواردی مانند ارائه بازخورد یا درخواست مجموعه داده از مشکلات اصلی پورتالهای دادههای دولتی باز است که سبب کاهش مشارکت شهروندان در استفاده از دادههای دولتی باز شده است. |
قابلیت استفاده از دادههای ارائه شده 41 پورتال داده دولتی باز براساس بازخورد 40 کاربر بررسی شده است. |
2021 |
نیکیفوروا و امسی برآید[3] |
قابلیت استفاده از پورتال دادههای دولتی باز: تحلیل کاربر محور 41 پورتال دادههای دولتی باز |
براساس یک تحلیل هفت مرحلهای، یک چارچوب مرجع مشترک برای ارزیابی کیفیت دادههای دولتی باز ارائه شده است که شامل شش معیار دقت، دسترسی، کامل بودن، بهموقع بودن، ثبات و قابل درک بودن است. بهبود وضعیت سازمانها براساس معیارهای بیانشده میتواند سبب افزایش مشارکت شهروندان در استفاده از دادههای دولتی باز شود. |
یک چارچوب مرجع مشترک برای ارزیابی کیفیت دادههای دولتی باز ارائه شده است. |
2020 |
ژنگ و ژیائو[4] |
چارچوب ارزیابی کیفیت دادههای دولتی باز (تجزیه و تحلیل تحقیقات کیفی، 2009-2019) |
ابعاد مشخص شده عبارتند از: غنای اطلاعاتی، قابلیت کشف، قابلیت استفاده مجدد و تعامل. مدل ارزیابی پیشنهادی برای انجام ارزیابی چهار پورتال دادههای دولتی باز ملی استفاده شده است. |
یک مدل ارزیابی برای پورتالهای دادههای دولتی باز براساس چند بعد اصلی که تأثیر زیادی بر مشارکت شهروندان در استفاده از دادههای دولتی باز دارد، مشخص شده است. |
2018 |
دهبی و همکاران[5] |
مدل ارزیابی پورتالهای داده دولتی باز |
نویسندگان پیشنهاد میکنند که مجموعه دادهها از نظر کامل بودن، دقت، قابل ردیابی بودن، قابل فهم بودن، انطباق و انقضا ارزیابی شوند. |
رویکردی برای اندازهگیری و بهبود کیفیت مجموعه دادههای دولتی باز بهمنظور افزایش مشارکت و استفاده شهروندان از دادهها ارائه شده است. |
2016 |
وترو و همکاران[6] |
چارچوب اندازهگیری کیفیت دادههای باز: تعریف و کاربرد برای دادههای دولتی باز |
نتایج نشان داد که آمادگی سازمانی و فشارهای خارجی دارای رابطه مثبت با انتشار دادهها توسط سازمانها است. |
معیارهای تأثیرگذار بر مشارکت آژانسهای دولتی تایوان در ارائه دادههای دولتی بهصورت باز مورد بررسی قرار گرفته است. |
2016 |
وانگ و لو[7] |
دادههای دولتی باز در بین سازمانهای دولتی |
گزارش شده است که درک مفید بودن، توانایی سازمانی، نفوذ خارجی و شرایط تسهیلکننده بر قصد سازمانهای دولتی در انتشار دادهها تأثیر مثبت میگذارد. |
از نظریهها و عوامل اجتماعی و فنی در انتشار دادههای باز در بین سازمانهای دولتی تایوان الگو گرفته شده است. |
2016 |
یانگ و وو[8] |
بررسی عوامل تعیینکننده فنی و اجتماعی تأثیرگذار بر انتشار دادههای باز سازمانهای دولتی |
همانطور که در پیشینه پژوهش ملاحظه میشود، هریک از پژوهشهای انجام شده بر بعد خاصی از بهبود کیفیت دادههای دولتی باز و افزایش تمایل شهروندان در استفاده از دادهها تمرکز کردهاند. همچنین، وزن و اهمیت هریک از این ابعاد و معیارها مشخص نشده است. در نظر گرفتن وزن و اهمیت هریک از این ابعاد و معیارها براساس میزان تمایلی که شهروندان تاکنون از دادهها داشتند، در پژوهشهای پیشین مورد توجه قرار نگرفته است. تعیین وضعیت سازمانها براساس معیارهای استخراج شده و استفاده از این اطلاعات بهمنظور خوشهبندی سازمانها با وضعیت مشابه و ایجاد یک مدل طبقهبندی[9] بهمنظور پیشبینی و کنترل وضعیت سازمانها انجام نشده است. ازاینرو در این پژوهش، پس از استخراج معیارهای جامع تأثیرگذار در مشارکت شهروندان در استفاده از دادههای دولتی باز براساس مطالعات کتابخانهای، به تعیین وضعیت سازمانها براساس هر معیار پرداخته است. سپس با استفاده از روشهای دادهکاوی و مدل رگرسیون، ویژگی دادههای سازمانهای با وضعیت مطلوب، استخراج شده است. همچنین به خوشهبندی سازمانها و تخصیص برچسب به هر خوشه، برای ایجاد یک مدل طبقهبندی بهمنظور پیشبینی و کنترل وضعیت سازمانهای ارائهدهنده دادههای دولتی باز پرداخته شده است. علاوه بر این، عوامل و محرکهای تأثیرگذار بر سازمانهای دولتی در ارائه دادهها بهصورت باز و وزن و اهمیت هر عامل استخراج و محاسبه شده است.
۲. روش پژوهش
در این پژوهش، نوع تحقیق برمبنای هدف از نوع تحقیقات کاربردی است. شکل 1، فرایند تحقیق شامل فازهای افزایش مشارکت شهروندان در استفاده از دادههای دولتی باز و افزایش مشارکت سازمانهای دولتی در ارائه دادهها بهصورت باز را نشان میدهد.
شکل 1. فرایند تحقیق
مأخذ: یافتههای تحقیق.
روش پژوهش، به تفکیک هریک از فازهای افزایش مشارکت شهروندان در استفاده از دادههای دولتی باز و افزایش مشارکت سازمانهای دولتی در ارائه دادهها بیان شده است.
۲-۱. افزایش مشارکت شهروندان در استفاده از دادههای دولتی باز
در این فاز به افزایش مشارکت شهروندان در استفاده از دادههای دولتی باز بهمنظور تحقق حکمرانی مشارکتی و مردمی و بهره بردن از مزایای ذکر شده آن پرداخته شده است. این فاز شامل چهار گام استخراج معیارهای مربوط به دادههای باز و تأثیرگذار در مشارکت شهروندان در استفاده از دادهها، تعیین وضعیت هر سازمان براساس معیارهای استخراج شده، استخراج ویژگیهای دادههای باز سازمانهای با وضعیت مطلوب و ایجاد یک مدل طبقهبندی است که هریک در ادامه توضیح داده شده است.
۲-۱-۱. استخراج معیارهای مربوط به دادههای باز و تأثیرگذار در مشارکت شهروندان
در این بخش، معیارهای مربوط به دادههای باز که در مشارکت شهروندان تأثیرگذارند استخراج شده است. بدینمنظور با مطالعات کتابخانهای، جامعه آماری شامل همه مقالات مرتبط با ابعاد و معیارهای مؤثر در افزایش مشارکت و تمایل شهروندان است. همچنین از روش نمونهگیری احتمالی از نوع نمونههای تصادفی ساده استفاده شده و 15 مقاله در این حوزه مورد بررسی قرار گرفته است.
۲-۱-۲. تعیین وضعیت هر سازمان براساس معیارهای استخراج شده
پس از استخراج معیارهای مربوط به دادههای دولتی باز که در مشارکت شهروندان مؤثر است، سازمانها، شامل تمامی سازمانها و مؤسسههای دولتی حاضر در سامانه ملی کاتالوگ و مجموعه دادههای باز و کاربردی[10] که به ارائه دادهها بهصورت باز میپردازند مورد بررسی قرار گرفتهاند و اطلاعات مرتبط با هر معیار که در بخش پیش استخراج شدهاند، برای هر سازمان محاسبه شده است. با توجه به اینکه تعداد سازمانهای دولتی ارائهدهنده دادههای باز در این سامانه 112 مورد بوده، اعضای جامع آماری شامل تمامی سازمانها و از نمونهگیری استفاده نشده است.
۲-1-3. استخراج ویژگیهای دادههای باز مورد استقبال شهروندان
در این بخش به تجزیه و تحلیل شبکه پیچیده شهروندان، سازمانها و مؤسسههای دولتی ارائهدهنده دادههای باز پرداخته شده است. این شبکه جهتدار است و گرهها در این شبکه؛ شهروندان، سازمانها و مؤسسههای دولتی هستند و لینکها، بازدید از دادهها را نشان میدهد. بهعنوان مثال در شکل 2، شبکهای از شهروندان و سازمانهای ارائهدهنده دادههای دولتی باز نشان داده شده است. لینک که از شهروند i به سازمان j متصل شده است، نشان میدهد که شهروند i از دادههای منتشر شده بهصورت باز سازمان j بازدید کرده است. در این شبکه، لینکهای جهتدار از شهروند به سازمان یا سازمان به سازمان دیگر میتواند وجود داشته باشد. اما امکان لینک جهتدار بین شهروندان یا سازمان به شهروند در این شبکه وجود ندارد. همچنین امکان ایجاد لینک از یک شهروند به چندین سازمان وجود دارد، یعنی یک شهروند میتواند از دادههای چندین سازمان بازدید کند.
شکل ۲. شبکه پیچیده شهروندان، سازمانها و مؤسسههای دولتی
مأخذ: همان.
از مرکزیت درجه بهمنظور شناسایی سازمانهایی که دادههای آنها مورد تمایل بیشتری قرار گرفتهاند، استفاده شده است. مرکزیت درجه مطلق گره vi از طریق رابطه 1 محاسبه میشود (Estrada, 2021):
(1) |
cD (i) = degree of vertex i |
مرکزیت درجه نسبی گره vi از طریق رابطه 2 قابل محاسبه است. n-1 بزرگترین درجه ممکن یک شبکه با n گره است.
(۲) |
CD (i) = cD (i)/(n-1) |
این اطلاعات از طریق سامانه ملی کاتالوگ و مجموعه دادههای باز و کاربردی براساس میزان بازدیدی که از مجموعه دادههای باز هر سازمان انجام شده، قابل استخراج است.
از تکنیکهای دادهکاوی بهمنظور استخراج ویژگیهای دادههای سازمانهایی که مورد تمایل بیشتری بودند (درجه مرکزیت بالاتری داشتند)، از مدل رگرسیون استفاده شده است. از معیارهای استخراج شده (در بخش ۱-۱-۲)، بهعنوان صفات خاصه و از دادهها (بخش 2-۱-۲) که دادههای سازمانها براساس هر معیار است، بهعنوان رکورد استفاده شده است. صفت خاصه «میزان بازدید» بهعنوان برچسب[11] آمده است. خروجی این مدل، ضرایب مرتبط با هر معیار است که وزن و اهمیت آن معیار را مشخص میکند.
۲-۱-۴. ایجاد مدل طبقهبندی
در این بخش به ایجاد یک مدل طبقهبندی، برای پیشبینی وضعیت سازمانها و همچنین چگونگی مدیریت و کنترل سازمانها بهمنظور دستیابی به وضعیتی پرداخته شده که دادههای آنها مورد استقبال بیشتر شهروندان قرار گیرد. بدینمنظور در ابتدا از روشهای دادهکاوی، شامل خوشهبندی بهمنظور شناسایی سازمانها با وضعیت مشابه و تخصیص برچسب به هر سازمان استفاده شده سپس، به ایجاد مدل طبقهبندی درخت تصمیم[12] براساس برچسبهای مشخص شده پرداخته شده است. همچنین از ماتریس درهمریختگی[13] و استفاده از معیارهایی مانند دقت[14]، برای ارزیابی مدل طبقهبندی ایجاد شده استفاده شده است.
۲-۲. افزایش مشارکت سازمانهای دولتی در ارائه دادهها بهصورت باز
در این فاز به افزایش مشارکت سازمانهای دولتی در ارائه دادهها بهصورت باز بهمنظور تحقق حکمرانی مشارکتی و مردمی و بهره بردن از مزایای ذکر شده آن پرداخته شده است. این فاز شامل دو گام استخراج عوامل و محرکهای سازمانهای دولتی در ارائه دادهها بهصورت باز و محاسبه وزن و اهمیت هریک از عوامل است. این دو گام در ادامه توضیح داده شده است.
۲-۲-۱. استخراج عوامل و محرکهای سازمانهای دولتی در ارائه دادهها بهصورت باز
در این فاز به استخراج عوامل و محرکها در ترغیب سازمانهای دولتی در ارائه دادهها بهصورت باز مطالعات کتابخانهای استفاده شده است.
۲-۲-۲. محاسبه وزن و اهمیت عوامل و محرکهای سازمانهای دولتی در ارائه دادهها بهصورت باز
پس از استخراج عوامل و محرکهایی که سبب مشارکت بیشتر سازمانهای دولتی در ارائه دادهها بهصورت باز میشود، به محاسبه وزن و اهمیت هریک از این عوامل با استفاده از روش میدانی و تکنیکهای تصمیمگیری چندمعیاره شامل تکنیک تحلیل سلسلهمراتبی[15] پرداخته شده است.
۳. یافتههای پژوهش
در این بخش به نتایج و یافتههای حاصل از اعمال روش پیشنهادی شامل فازهای افزایش مشارکت شهروندان در استفاده از دادههای دولتی باز و افزایش مشارکت سازمانهای دولتی در ارائه دادهها بهصورت باز بهمنظور تحقق حکمرانی مشارکتی و مردمی و بهره بردن از مزایای ذکر شده آن پرداخته شده است.
۳-۱. افزایش مشارکت شهروندان در استفاده از دادههای دولتی باز
۳-۱-۱. استخراج معیارهای مربوط به دادههای باز و تأثیرگذار در مشارکت شهروندان
ابعاد و معیارهای استخراج شده بههمراه مرجع مربوطه در ادامه بیان شده است.
۳-۱-۱-۱. باز بودن داده
الف) اصالت دادهها (Veljković, Bogdanović-Dinić and Stoimenov, 2014; Vetro etal., 2016)
ب) عدم وجود دادههای از دست رفته (Dahbi, Lamharhar and Chiadmi, 2018)
(۳) |
Oi = ) Tj |
الف) کامل بودن فراداده (Dahbi, Lamharhar and Chiadmi, 2018; Zheng etal., 2020; Huang etal., 2019; Saxena, 2018): این معیار کامل بودن فراداده توصیفی را ارزیابی میکند که شامل عنوان، توضیحات، برچسبها، ناشر و غیره برای هر مجموعه داده است.
الف) تعداد مجموعه داده(Dahbi, Lamharhar and Chiadmi, 2018; Huang etal., 2019; Vetro etal., 2016; :Saxena, 2018) این معیار تعداد مجموعه دادههایی که یک سازمان بهصورت باز ارائه کرده است را ارزیابی میکند.
۳-۱-۱-۲. شفافیت داده
الف) باز بودن مجوز (سایت داده باز جهانی، ۲۰۱۸؛ (Veljković, Bogdanović-Dinić and Stoimenov, 2014; Dahbi, Lamharhar and Chiadmi, 2018): این معیار، باز بودن مجوز مجموعه داده برای استفاده مجدد را ارزیابی میکند.
۳-۱-۱-۴. تعامل
۳-۱-۲. تعیین وضعیت سازمانها براساس معیارهای استخراج شده
شکل 3، نمایی از اطلاعات استخراج شده سازمانها و مؤسسههای دولتی حاضر در سامانه ملی کاتالوگ و مجموعه دادههای باز و کاربردی براساس معیارهای بیان شده را نشان میدهد.
شکل 3. نمایی از اطلاعات استخراج شده سازمانها براساس هر معیار
مأخذ: همان.
۳-۱-۳. استخراج ویژگیهای دادههای باز مورد استقبال شهروندان
۳-۱-۳-۱. تجزیه و تحلیل شبکه پیچیده شهروندان، سازمانها و مؤسسههای دولتی
در این بخش، شبکه پیچیده شهروندان، سازمانها و مؤسسههای دولتی حاضر در سامانه ملی کاتالوگ و مجموعه دادههای باز و کاربردی، مورد بررسی قرار گرفتند. بهمنظور شناسایی سازمانها و مؤسسههای دولتی با مرکزیت درجه بالا، لینکهای ورودی از شهروندان به سازمانها که نشاندهنده درجه ورودی[17] هر سازمان است، محاسبه شد. این اطلاعات براساس میزان بازدید از مجموعه دادههای هر سازمان در سامانه ملی کاتالوگ و مجموعه دادههای باز و کاربردی، در دسترس بود. شکل 4، نمونهای از استخراج میزان بازدید براساس مجموعه داده و سازمان انتخاب شده را نشان میدهد.
شکل 4. نمونهای از استخراج میزان بازدید براساس مجموعه داده و سازمان انتخاب شده
مأخذ: همان.
۳-۱-۳-۲. استفاده از تکنیکهای دادهکاوی بهمنظور محاسبه وزن و اهمیت هر معیار
همانطور که پیشتر بیان شد در این بخش، قصد داریم وزن و اهمیت هر معیار را براساس میزان تمایلی محاسبه کنیم که شهروندان تاکنون از مجموعه دادههای هر سازمان داشتهاند. بدین صورت که مجموعه دادههای سازمانهای با وضعیت مطلوب که مورد تمایل بیشتر شهروندان بوده است، مشخص شوند. سپس ویژگیهای این مجموعه دادهها استخراج و بر این اساس وزن و اهمیت هر معیار تعیین شود. بنابراین معیارهای استخراج شده، بهعنوان صفات خاصه در نظر گرفته شدهاند. رکوردها شامل دادههای استخراج شده هر سازمان براساس این معیارها هستند. از صفت خاصه میزان بازدید بهعنوان برچسب استفاده شده است. همچنین نام سازمانها و مؤسسههای دولتی بهعنوان آیدی در نظر گرفته شده است. در این بخش، از مدل رگرسیون بهمنظور تجزیه و تحلیل دادهها و محاسبه وزن و اهمیت هر معیار استفاده شده است. خروجی این مدل، ضرایبی است که وزن و اهمیت هر معیار را مشخص میکند. بدینمنظور از نرمافزار رپیدماینر[18] استفاده شده است. شکل 5، اپراتورهای استفاده شده در این نرمافزار را نشان میدهد.
شکل 5. اپراتورهای استفاده شده در نرمافزار رپیدماینر بهمنظور محاسبه ضرایب رگرسیون
مأخذ: همان.
از اپراتور تقسیم داده[19] بهمنظور تقسیم دادهها به دو مجموعه دادههای آموزش و تست استفاده شده است. 70 درصد دادهها بهعنوان دادههای آموزش و 30 درصد باقیمانده بهعنوان دادههای تست در نظر گرفته شد. شکل 6، دادههای آموزش شامل صفات خاصه، رکوردها، آیدی و برچسب را نشان میدهد. تعداد دادههای آموزش، 78 مورد بود که بهصورت تصادفی از کل 112 مورد موجود انتخاب شدند.
شکل ۶. دادههای آموزش
مأخذ: همان.
از اپراتور رگرسیون خطی[20] بهمنظور تحلیل دادهها و محاسبه ضرایب رگرسیون استفاده شده است. شکل 7، ضرایب محاسبه شده را نشان میدهد. علامت مثبت، تأثیر مثبت معیار مشخص شده را در برچسب نشان میدهد که میزان بازدید شهروندان از مجموعه دادهها است. هرچه ضریب یک معیار، مثبت و بزرگتر باشد، آن معیار، تأثیر بیشتری در افزایش میزان بازدید شهروندان از دادههای دولتی باز دارد. علامت منفی، نشاندهنده تأثیر منفی معیار مشخص شده در میزان بازدید است. هرچه ضریب یک معیار، منفی و بزرگتر باشد، آن معیار، تأثیر بیشتری در کاهش میزان بازدید شهروندان از دادههای دولتی باز دارد.
شکل 7. ضرایب رگرسیون مرتبط با هر معیار
مأخذ: همان.
همانطور که در شکل 7 مشاهده میشود، معیار «موضوع جامعه» با دارا بودن ضریب ۵۶۴/۷۲ و علامت مثبت، بیشترین تأثیر را در برچسب داشته است که میزان بازدید شهروندان از دادههای دولتی باز است. بدینمعنا که شهروندان به مجموعه دادههایی که دارای موضوع جامعه هستند، تمایل بیشتری داشتند. پس از آن، معیار «باز بودن قالب» با دارا بودن ضریب ۶۸۲/۵۲ و علامت مثبت، رتبه دوم را در افزایش میزان بازدید داشته است. لذا شهروندان به مجموعه دادههایی که قابلیت خواندن توسط ماشین را دارند، تمایل بیشتری داشتند. معیارهای «کامل بودن فراداده»، «تعداد مجموعه داده»، «قابل فهم بودن»، «اصالت دادهها»، «رایگان بودن»، «عدم دادههای از دست رفته»، «تبعیضآمیز نبودن» و «باز بودن مجوز» با دارا بودن علامت مثبت، بهترتیب رتبههای بعدی در افزایش میزان بازدید شهروندان از دادههای دولتی باز را کسب کردند. نکتهای که حائز اهمیت است، اینکه معیار «تعداد دستههای داده» دارای علامت منفی است، بدینمعنا که شهروندان تمایل بیشتر به مجموعه دادههایی داشتهاند که تمرکز بیشتر روی یک موضوع خاص دارد. همچنین «موضوع مزرعهداری» با دارا بودن علامت منفی و ضریب ۴۱۳/۱۶۰ بیشترین تأثیر منفی را در بازدید شهروندان از دادههای دولتی باز داشته است. بدینمعنا که شهروندان به بازدید از مجموعه دادههای با موضوع مزرعهداری تمایلی نداشتهاند.
بهمنظور ارزیابی مدل رگرسیون ایجاد شده و اطمینان از ضرایب بهدست آمده، از دادههای تست استفاده شد. از 30 درصد کل دادهها بهعنوان دادههای تست مورد استفاده قرار گرفت. تعداد دادههای تست، 78 مورد بود که بهصورت تصادفی از کل 112 مورد موجود انتخاب شدند. شکل 8، دادههای تست با میزان پیشبینی شده برای برچسب که میزان بازدید است با استفاده از مدل رگرسیون ایجاد شده را نشان میدهد. همچنین میزان واقعی بازدید نیز نشان داده شده است.
شکل 8. دادههای تست بههمراه مقدار پیشبینی شده برای برچسب و مقدار واقعی برچسب
مأخذ: همان.
از خطای جذر میانگین مربعات[21] بهعنوان ارزیابی مدل رگرسیون ایجاد شده استفاده شد که برابر مقدار ۴۳۵/۱۹۹۸ بود. با توجه به خطای جذر میانگین مربعات بهدست آمده، مقدار خطای جذر میانگین مربعات نرمال شده[22] برابر ۰۱۴/۰ (1.4 درصد) بود که طبق نوشته فو[23] (2005) چون کمتر از 10 درصد است، نشانگر وضعیت مطلوب مدل رگرسیون ایجاد شده است.
۳-۱-۴. پیشبینی و کنترل وضعیت سازمانها
۳-۱-۴-۱. خوشهبندی
بهمنظور شناسایی سازمانها و مؤسسههای دولتی با وضعیت مشابه، تخصیص برچسب به هر خوشه و ایجاد یک مدل طبقهبندی بهمنظور پیشبینی و کنترل وضعیت سازمانها، از خوشهبندی استفاده شده است. برای این کار در ابتدا نیاز است تعداد خوشههای بهینه مشخص شود. بدینمنظور از کدنویسی در R استفاده شده که در ادامه توضیح داده شده است.
الف) تعیین تعداد خوشههای بهینه
بهمنظور شناسایی تعداد خوشههای بهینه از کدنویسی در R و کتابخانه NbClust استفاده شده است. معیارهاSilhouette ، Elbow، Gap Statistic و Pseudo بودند. اکثر معیارها، سه خوشه را بهعنوان تعداد خوشه بهینه پیشنهاد دادند.
ب) الگوریتم خوشهبندی
در این بخش به اعمال الگوریتم خوشهبندی بر دادههای استخراج شده سازمانها براساس هر معیار، پرداخته شده است. بهدلیل حساس بودن الگوریتم K-means به دادههای پرت[24] از الگوریتم K-medoids استفاده شده است. بدینمنظور نرمافزار رپیدماینر مورد استفاده قرار گرفته است. پس از استفاده از الگوریتم K-medoid، سه خوشه شامل خوشه 0، خوشه 1 و خوشه 2 تشکیل شدند و سازمانها براساس شباهتشان به یکدیگر در این خوشهها قرار گرفتند.
ج)تخصیص برچسب به هر خوشه
بهمنظور تخصیص برچسب به هر خوشه، از صفت خاصه «میزان بازدید» استفاده شده است. این صفت خاصه، میزان بازدید شهروندان از دادههای دولتی باز هر سازمان را نشان میدهد. برچسبهای در نظر گرفته شده و تعداد سازمانها و مؤسسههای مرتبط با هر برچسب در جدول 2 مشخص شده است.
جدول 2. برچسبهای تخصیصیافته به هر خوشه و تعداد سازمانهای مرتبط با هر برچسب
تعداد سازمانها با برچسب مشخص شده |
تعریف برچسب |
برچسب |
خوشه |
2 |
میزان بازدید بالاتر از 10000 |
بازدید بالا (HV) |
خوشه 0 |
74 |
میزان بازدید بین 100 تا 10000 |
بازدید متوسط (MV) |
خوشه 1 |
36 |
میزان بازدید کمتر از 100 |
بازدید پایین (LV) |
خوشه 2 |
مأخذ: یافتههای تحقیق.
۳-۱-۴-۲. مدل طبقهبندی
الف) ایجاد مدل طبقهبندی درخت تصمیم
پس از برچسبگذاری، به ایجاد مدل طبقهبندی درخت تصمیم با استفاده از نرمافزار رپیدماینر پرداخته شد. در این مدل، از 80 درصد دادهها بهعنوان دادههای آموزش استفاده شد و 20 درصد باقیمانده بهعنوان دادههای تست در نظر گرفته شد. شکل 9، درخت تصمیم ایجاد شده را نشان میدهد.
شکل 9. درخت تصمیم
مأخذ: همان.
با استفاده از درخت تصمیم ایجاد شده در شکل 9، میتوان به پیشبینی وضعیت سازمانها در ارائه دادههای دولتی باز پرداخت. برای مثال اگر تعداد مجموعه دادهها کوچکتر از 7 و تعداد دستههای داده بزرگتر از 2 باشد، وضعیت سازمان برابر MV یعنی میزان بازدید متوسط خواهد بود. همچنین با استفاده از درخت تصمیم ایجاد شده میتوان به کنترل وضعیت سازمانها و بهبود وضعیت آنها در جهت افزایش مشارکت و استفاده شهروندان از دادههای باز پرداخت. بهعنوان مثال، اگر وضعیت یک سازمان برابر میزان بازدید کم باشد میتوان با افزایش تعداد مجموعه دادهها، افزایش بصریسازی و دسترسی داده، آن را به وضعیت میزان بازدید متوسط سوق داد.
ب) ارزیابی مدل طبقهبندی ایجاد شده
در این بخش به ارزیابی مدل طبقهبندی ایجاد شده پرداخته شده است. شکل 10، ماتریس درهمریختگی درخت تصمیم ایجاد شده را نشان میدهد.
شکل 10. ماتریس درهمریختگی درخت تصمیم ایجاد شده
مأخذ: همان.
دقت مدل طبقهبندی ایجاد شده برابر ۹۱/۹۰٪ است که نشان از مطلوب بودن مدل دارد. همچنین مقادیر سایر معیارها مانند صحت[25] و پوشش[26] در شکل 10 نشان داده شده است.
۳-۲. افزایش مشارکت سازمانهای دولتی در ارائه دادهها بهصورت باز
در این قسمت به نتایج حاصل از استخراج عوامل و محرکهای سازمانهای دولتی در ارائه دادهها بهصورت باز و محاسبه وزن و اهمیت هر معیار پرداخته شده است.
۳-۲-۱. استخراج عوامل و محرکهای سازمانهای دولتی در ارائه دادهها بهصورت باز
اکثر چالشهای موجود مانند بهروز نبودن دادهها، کم بودن تعداد مجموعه دادههای ارائه شده، عدم مواردی مانند تجسم دادهها و غیره در این است که سازمانهای دولتی تمایلی برای به اشتراکگذاری دادههای خود ندارند. در ادامه عوامل و محرکها برای ترغیب سازمانهای دولتی در اشتراکگذاری دادهها و درنتیجه بهبود حکمرانی مشارکتی و مردمی و بهره بردن از مزایای آن بیان شده است.
۳-۲-۲. محاسبه وزن و اهمیت عوامل و محرکهای سازمانهای دولتی در ارائه دادهها بهصورت باز
در این بخش به محاسبه وزن و اهمیت عوامل و محرکهای ترغیب سازمانها در ارائه دادهها بهصورت باز براساس روش تحلیل سلسلهمراتبی پرداخته شده است. بدینمنظور پرسشنامهای طراحی شد و از خبرگان خواسته شد به مقایسه زوج عوامل بپردازند. نمودار 1، رتبه و وزنهای حاصل از اعمال روش تحلیل سلسلهمراتبی بر عوامل بیان شده را نشان میدهد. مجموع وزنها برابر با 1 است. گفتنی است نرخ ناسازگاری، ۰۲۸/۰ بود که چون کمتر از ۱/۰ است، پایایی پرسشنامهها را تأیید میکند.
نمودار ۱. وزن و اهمیت محرکهای سازمانهای دولتی در ارائه دادهها بهصورت باز براساس روش تحلیل سلسلهمراتبی
مأخذ: همان.
براساس نتایج کسب شده، عوامل «نیاز به تبعیت از مقامات بالاتر» با وزن ۲۰۱/۰ «کاهش حساسیت عملیات کاری سازمان» با وزن ۱۸/۰ و «نیاز به منابع مالی» با وزن ۱۷۴/۰ بهترتیب سه رتبه نخست در بین عوامل و محرکها در ترغیب سازمانها به ارائه دادهها بهصورت باز و بهبود حکمرانی مشارکتی و مردمی دارند.
۴. جمعبندی و نتیجهگیری
تحقق حکمرانی مشارکتی و بهره بردن از مزایای آن زمانی صورت میگیرد که هم سازمانها و مؤسسههای دولتی به ارائه دادههای خود بهصورت باز بپردازند و هم مردم از این دادهها برای ارائه نظرها و ایدهها و خلق ارزش استفاده کنند. ازاینرو در این پژوهش به بررسی عوامل و محرکهای تأثیرگذار در مشارکت سازمانهای دولتی در ارائه دادهها بهصورت باز و مشارکت شهروندان در استفاده از دادهها پرداخته شد. در بخش افزایش مشارکت شهروندان در استفاده از دادههای باز، هریک از پژوهشهای صورت گرفته فقط بر بعد خاصی از دادههای دولتی باز متمرکز شدهاند و یک مجموعه معیار جامع و کامل وجود ندارد. بهعنوان مثال در پژوهش نیکیفوروا و امسیبرآید (2021)، فقط معیارهای امکان بازخورد و درخواست مجموعه داده بهعنوان معیارهای تأثیرگذار در افزایش تمایل شهروندان در استفاده از دادهها در نظر گرفته شده است. اما در این پژوهش، پس از مطالعات کتابخانهای و بررسی مقالات مرتبط، معیارهای جامع تأثیرگذار در افزایش تمایل شهروندان در استفاده از دادهها شامل «اصالت دادهها»، «باز بودن مجوز»، «بهروز بودن»، «میزان دسترسی به داده»، «کامل بودن فراداده»، «تعداد مجموعه داده»، «باز بودن قالب»، «تبعیضآمیز نبودن»، «قابل فهم بودن»، «تعداد دستههای داده»، «رایگان بودن»، «عدم دادههای از دست رفته»، «امکان درخواست داده»، «تجسمی بودن»، «بازخوردپذیر» و «موضوع مجموعه داده» ارائه شده است.
مشکل دیگر موجود در پژوهشهای پیشین این است که میزان اهمیت هر بعد و معیار، در نظر گرفته نشده است؛ بهعنوان مثال در پژوهش ژنگ و ژیائو (2020)، شش معیار دقت، دسترسی، کامل بودن، بهموقع بودن، ثبات و قابل درک بودن بهعنوان معیارهای تأثیرگذار در استفاده از دادههای دولتی باز بیان شده است، اما مشخص نیست کدام معیارها اهمیت بالاتری دارند. همچنین در پژوهش وترو و همکاران (2016)، نویسندگان پیشنهاد میکنند که مجموعه دادهها از نظر کامل بودن، دقت، قابل ردیابی بودن، قابل فهم بودن، انطباق و انقضا ارزیابی شوند. با وجود جامع نبودن معیارهای ارائه شده، وزن و اهمیت این معیارها مشخص نیست. نکته مهمتر اینکه در هیچیک از پژوهشهای پیشین، وزن و اهمیت هر معیار، براساس تمایلی که تاکنون شهروندان از دادههای دولتی باز مختلف داشتهاند، محاسبه نشده است. نکات بیانشده، در این پژوهش مدّنظر قرار گرفته است و براساس نتایج بهدستآمده، معیار «موضوع جامعه» با دارا بودن ضریب ۵۶۴/۷۲ و علامت مثبت، بیشترین تأثیر را در افزایش میزان بازدید شهروندان از دادههای دولتی باز داشت. پس از آن، معیار «باز بودن قالب» با دارا بودن ضریب ۶۸۲/۵۲ و علامت مثبت، رتبه دوم را در افزایش میزان بازدید داشته است. معیارهای «کامل بودن فراداده»، «تعداد مجموعه داده»، «قابل فهم بودن»، «اصالت دادهها»، «رایگان بودن»، «عدم دادههای از دست رفته»، «تبعیضآمیز نبودن» و «باز بودن مجوز» با دارا بودن علامت مثبت، بهترتیب رتبههای بعدی را در افزایش میزان بازدید شهروندان از دادههای دولتی باز کسب کردند. ضریب معیار «تعداد دستههای داده» دارای علامت منفی بود، بدین معنا که شهروندان تمایل بیشتر به مجموعه دادههایی داشتهاند که تمرکز روی یک موضوع خاص دارد. همچنین «موضوع مزرعهداری» با دارا بودن علامت منفی و ضریب ۴۱۳/۱۶۰ بیشترین تأثیر منفی را در بازدید شهروندان از دادههای دولتی باز داشته است.
مسئله دیگر که در پژوهشهای پیشین مورد توجه قرار نگرفته است، عدم ارائه یک مدل طبقهبندی است. ارائه یک مدل طبقهبندی میتواند به پیشبینی و کنترل وضعیت سازمانهای ارائهدهنده دادههای دولتی باز بهمنظور افزایش مشارکت شهروندان در استفاده از دادهها و بهبود حکمرانی مشارکتی و مردمی کمک کند. در این پژوهش، به خوشهبندی سازمانها، پرداخته شد. سپس با بررسی صفت خاصه میزان بازدید شهروندان از دادههای دولتی باز هر سازمان، تخصیص برچسب به هر خوشه صورت گرفت. این برچسبها نشاندهنده وضعیت هر سازمان است. پس از تخصیص برچسب به هر سازمان، به ارائه مدل طبقهبندی درخت تصمیم بهمنظور پیشبینی و کنترل وضعیت سازمانها برای سوق دادن وضعیت آنها به وضعیت مطلوب پرداخته شد که افزایش مشارکت و استفاده شهروندان از دادههای دولتی باز است.
در بخش مربوط به عوامل و محرکهای ترغیبکننده سازمانهای دولتی در ارائه دادهها بهصورت باز نیز بهرغم کامل و جامع نبودن محرکهای بیان شده در پژوهشهای صورت گرفته، وزن و اهمیت هر عامل محاسبه نشده است. بهعنوان مثال در پژوهش یانگ و وو (2016)، تنها گزارش شده است که درک مفید بودن، توانایی سازمانی، نفوذ خارجی و شرایط تسهیلکننده بر قصد سازمانهای دولتی در انتشار دادهها تأثیر مثبت میگذارد. اما وزن و اهمیت هر عامل مشخص نشده است که در این پژوهش با استفاده از روش میدانی و استفاده از تکنیکهای تصمیمگیری چندمعیاره به محاسبه اهمیت هر عامل پرداخته شد. براساس مطالعات و بررسی مقالات، 6 عامل شامل «نیاز به تبعیت از مقامات بالاتر»، «کاهش حساسیت عملیات کاری سازمان»، «نیاز به منابع مالی»، «نیاز به ایجاد شفافیت»، «نیاز به منابع انسانی» و «نیاز به منابع فناوری اطلاعات» استخراج شدند. در این پژوهش نیز با روش تحلیل سلسلهمراتبی برای محاسبه وزن و اهمیت هر عامل استفاده شد و عوامل «نیاز به تبعیت از مقامات بالاتر» با دارا بودن وزن ۲۰۱/۰، «کاهش حساسیت عملیات کاری سازمان» با دارا بودن وزن ۱۸/۰ و «نیاز به منابع مالی» با دارا بودن وزن ۱۷۴/۰ بهترتیب سه رتبه نخست در بین عوامل و محرکهای مؤثر در افزایش مشارکت سازمانهای دولتی در ارائه دادهها بهصورت باز را کسب کردند.
براساس نتایج و یافتههای این پژوهش، میتوان برخی از پیشنهادهای سیاستی زیر را بهمنظور افزایش تمایل سازمانها در ارائه دادهها بهصورت باز و افزایش مشارکت شهروندان در استفاده از دادههای دولتی باز، بهمنظور تحقق حکمرانی مشارکتی و مردمی و بهره بردن از مزایای آن بیان کرد.
اقدامهای انجام شده و یافتههای بهدستآمده از این پژوهش، شامل استخراج معیارهای جامع مربوط به دادههای دولتی باز و مؤثر در افزایش مشارکت شهروندان در استفاده از دادهها، محاسبه وزن و اهمیت هر معیار با بررسی شبکه پیچیده شهروندان و سازمانها، ارائه یک مدل طبقهبندی بهمنظور پیشبینی و کنترل وضعیت سازمانها و همچنین ارائه عوامل و محرکهای سازمانهای دولتی در ارائه دادهها بهصورت باز و محاسبه وزن و اهمیت هر عامل، میتواند به مدیران در تصمیمگیری و مدیریت صحیح بهمنظور بهبود حکمرانی مشارکتی و مردمی و درنتیجه بهره بردن از مزایای آن کمک کند.
[1] .Open Data
[2] .Multi-Criteria Decision Making (MCDM)
[3] .Nikiforova and McBride
[4] .Zhang and Xiao
[5] .Dahbi, Lamharhar and Chiadmi
[6] .Vetrò etal.
[7] .Wang and Lo
[8] .Yang and Wu
[9] .Classification Model
[11] .Label
[12] .Decision Tree
[13] .Confusion Matrix
[14] .Accuracy
[15] .Analytical Hierarchy process (AHP)
[16] .https://index.okfn.org/place/
[17] .Indegree
[18] .Rapid Miner
[19] .Split Data
[20]. Linear Regression
[21] .Root Mean Square Error (RMSE)
[22] .Normal Root Mean Square Error (NRMSE)
[23] .Fu
[24] .Outlier
[25] .Precision
[26] .Recall