سازوکارهای حکمرانی مشارکتی و مردمی با استفاده از داده‌های دولتی باز

نوع مقاله : مقاله پژوهشی

نویسندگان

1 استادیار گروه مهندسی کامپیوتر، دانشکده مهندسی، دانشگاه بزرگمهر قائنات، قائنات، ایران (نویسنده مسئول)؛

2 استادیار، پژوهشگاه ارتباطات و فناوری اطلاعات، تهران، ایران؛

چکیده

حکمرانی مشارکتی و همکاری بین حکومت و مردم، سبب دستیابی به منابع انسانی و ایده‌های شهروندان، تصمیم‌گیری‌های آگاهانه‌تر، کاهش فساد و هدررفت بودجه و غیره خواهد شد و درنتیجه حکومت مردم‌سالار به‌وجود می‌آید. با توجه به‌ ضرورت بیان شده، هدف این پژوهش بررسی روش‌های افزایش مشارکت سازمان‌های دولتی در ارائه داده‌ها به‌صورت باز یعنی داده‌هایی که آزاد و رایگان در اختیار مردم قرار می‌گیرد و همچنین بررسی روش‌های افزایش مشارکت شهروندان در استفاده از داده‌ها است. بدین‌منظور، از مطالعات کتابخانه‌ای برای استخراج معیارهای تأثیرگذار در افزایش تمایل شهروندان در استفاده از داده‌ها و استخراج عوامل و محرک‌ها در ترغیب سازمان‌های دولتی در ارائه داده‌ها به‌صورت باز استفاده‌ شده است. سپس، تمامی سازمان‌ها و مؤسسه‌های دولتی حاضر در سامانه ملی کاتالوگ و مجموعه داده‌های باز و کاربردی که به ارائه داده‌ها به‌صورت باز می‌پردازند مورد بررسی قرار گرفته‌اند و وضعیت هر سازمان با توجه به هر معیار استخراج و مشخص شده است. سپس با روش داده‌کاوی، ویژگی‌های داده‌های سازمان‌هایی که مورد تمایل و استفاده بیشتر شهروندان بوده مشخص‌ شده است. همچنین با استفاده از روش میدانی و تکنیک‌های تصمیم‌گیری چندمعیاره، وزن و اهمیت عوامل تأثیرگذار در مشارکت سازمان‌ها در ارائه داده‌ها به‌صورت باز محاسبه شده‌ است. پس از مطالعات کتابخانه‌ای، معیار‌های «اصالت داده‌ها»، «باز بودن مجوز»، «به‌روز بودن»، «میزان دسترسی به داده»، «کامل بودن فراداده»، «تعداد مجموعه داده»، «باز بودن قالب»، «تبعیض‌آمیز نبودن»، «قابل فهم بودن»، «تعداد دسته‌های داده»، «رایگان بودن»، «عدم داده‌های از‌دست‌رفته»، «امکان درخواست داده»، «تجسمی بودن»، «بازخوردپذیر» و «موضوع مجموعه داده» به‌عنوان معیارهای جامع تأثیرگذار در افزایش تمایل شهروندان در استفاده از داده‌ها استخراج شدند. براساس نتایج به‌دست‌ آمده، معیار «موضوع جامعه» با دارا بودن ضریب 72/564 و علامت مثبت، بیشترین تأثیر را در افزایش میزان بازدید شهروندان از داده‌های دولتی باز داشت. پس از آن، معیار «باز بودن قالب» با دارا بودن ضریب 52/682 و علامت مثبت، رتبه دوم را در افزایش میزان بازدید داشته است. همچنین، براساس مطالعات کتابخانه‌ای، 6 عامل «نیاز به تبعیت از مقامات بالاتر»، «کاهش حساسیت عملیات کاری سازمان»، «نیاز به منابع مالی»، «نیاز به ایجاد شفافیت»، «نیاز به منابع انسانی» و «نیاز به منابع فناوری اطلاعات» به‌عنوان عوامل تأثیرگذار در مشارکت سازمان‌های دولتی در ارائه داده‌ها به‌صورت باز استخراج شدند. 

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Mechanisms of Participatory and Public Governance Using Open Government Data

نویسندگان [English]

  • Mohammad Moradi 1
  • Mojtaba Mazoochi 2
1 Assistant Professor, Department of Computer Engineering, Faculty of Engineering, Bozormehr University of Qaenat, Qaenat, Iran (corresponding author);
2 Assistant Professor, Research Institute of Communication and Information Technology, Tehran, Iran;
چکیده [English]

Participatory governance and collaboration between the government and the public lead to access to human resources and citizen ideas, more informed decision-making, reduced corruption and budget waste, and so on, resulting in the emergence of a democratic government. Participatory governance occurs when both government organizations provide their data to citizens and citizens use the provided data to generate ideas and create value. Given this necessity, the aim of this research is to examine methods for increasing the participation of government organizations in providing open data, meaning data that is freely and openly available to the public, as well as examining methods for increasing citizen participation in using the data. To this end, library studies were used to extract influential criteria for increasing citizens' willingness to use data and to identify factors and incentives for encouraging government organizations to provide data openly. Subsequently, all government organizations and institutions present in the national catalog and open and applicable data system that provide data openly were examined, and the status of each organization was extracted and specified based on each criterion. Given that the number of government organizations providing open data in this system was 112, it constituted the entire statistical population, and sampling was not used. Then, using data mining methods, the characteristics of the data from organizations that were more preferred and used by citizens were identified. Additionally, using field methods and multi-criteria decision-making techniques, the weight and importance of the influential factors in the participation of organizations in providing data openly were calculated. After library studies, the criteria of "data authenticity", "license openness", "up-to-dateness", "data accessibility", "metadata completeness", "number of datasets", "format openness", "non-discrimination", "understandability", "number of data categories", "free availability", "absence of missing data", "possibility of data requests", "visualization", "feedback capability", and "data set subject" were extracted as comprehensive influential criteria for increasing citizens' willingness to use data. Based on the results obtained, the criterion "community subject" with a coefficient of 72.564 and a positive sign had the greatest impact on increasing citizens' visits to open government data. Following that, the criterion "format openness" with a coefficient of 52.682 and a positive sign ranked second in increasing visit rates. Additionally, based on library studies, six factors—"need to comply with higher authorities", "reduction of operational sensitivity of the organization", "need for financial resources", "need for transparency", "need for human resources" and "need for information technology resources"—were identified as influential factors in the participation of government organizations in providing data openly. The findings of this research can assist managers in making informed decisions and effective management to improve participatory and public governance, thereby benefiting from its advantages.

کلیدواژه‌ها [English]

  • Open Data
  • Open Government Data
  • Participatory Governance

مقدمه

حکمرانی مشارکتی بر مشارکت عمیق و دمکراتیک با مشارکت شهروندان تمرکز دارد و ایده پشتیبان آن این است که شهروندان باید نقش مستقیم‌تری را در تصمیمات عمومی داشته باشند، یا حداقل در مسائل سیاسی عمیق‌تر دخیل شوند. در عمل، این نوع حکمرانی می‌تواند مکمل نقش شهروندان، به‌عنوان رأی‌دهنده و ناظر کارکردهای دولت باشد (Fu, 2019؛ ژاله باغبادرانی، یعقوبی‌پور و فتحی‌زاده، 1400). همکاری بین حکومت و شهروندان، سبب دستیابی به منابع انسانی و ایده‌های شهروندان، تصمیم‌گیری‌های آگاهانه‌تر، کاهش فساد و هدررفت بودجه و غیره می‌شود و درنتیجه ایجاد یک حکومت مردم‌سالار را در پی خواهد داشت که این موضوع، اهمیت توجه به مسئله حکمرانی مشارکتی را بیان می‌کند (امام‌جمعه‌زاده، 1395). برای مثال، زمانی که دولت، اطلاعات مربوط به نحوه و میزان تخصیص بودجه به نهادهای مختلف را در اختیار شهروندان قرار دهد، شهروندان می‌توانند بر آن نظارت کرده و از هدررفت بودجه و فساد جلوگیری کنند. همچنین، آنها می‌توانند ایده‌های خود را در این خصوص بیان کنند. در وضعیت کنونی کشور، سازمان‌های دولتی داده‌های کمی به شهروندان ارائه داده‌اند که این تعداد از مجموعه داده‌ها مناسب نیست و اغلب مشکلات عدم به‌روز بودن، عدم فراداده، عدم قابل خواندن ماشین و غیره را داراست. درواقع می‌توان گفت این مشکلات نشان ‌می‌دهد که سازمان‌ها به ارائه داده‌های خود به شهروندان تمایلی ندارند. همچنین، بررسی میزان بازدیدها از داده‌هایی که در دسترس عموم قرار گرفته‌اند، نشان می‌دهد شهروندان نیز تمایل کمی به استفاده از این داده‌ها دارند. این مشکل می‌تواند به دلایل مختلفی مانند موضوع مجموعه داده‌ها و غیره باشد. وضعیت مطلوب زمانی رخ می‌دهد که هم سازمان‌ها به ارائه داده‌های خود به شهروندان بپردازند و هم شهروندان در استفاده از داده‌ها، تمایل نشان دهند. ازاین‌رو به‌منظور تحقق حکمرانی مشارکتی و دستیابی به مزایای ذکر شده آن، افزایش تمایل سازمان‌ها در ارائه داده‌ها و همچنین افزایش تمایل شهروندان در استفاده از داده‌ها، ضروری است.

با توجه به ضرورت بیان‌ شده، هدف این پژوهش بررسی روش‌های افزایش مشارکت سازمان‌های دولتی در ارائه داده‌های باز[1] یعنی داده‌هایی که آزاد و رایگان در اختیار مردم قرار گرفته‌اند (Enders, Benz and Satzger, 2021) و همچنین بررسی روش‌های افزایش مشارکت مردم در استفاده از داده‌ها است. بدین‌منظور، در فاز اول، به استخراج معیارهای مؤثر در افزایش تعامل و استفاده شهروندان از داده‌ها براساس مطالعات کتابخانه‌ای پرداخته شده‌ است. جامعه آماری شامل همه مقالات مرتبط با معیارهای مؤثر در تمایل شهروندان در استفاده از داده‌های باز بوده است. از روش نمونه‌گیری احتمالی از نوع نمونه‌های تصادفی ساده استفاده شده و 15 مقاله در این حوزه بررسی شده‌ است. سپس همه سازمان‌ها و مؤسسه‌های دولتی حاضر در سامانه ملی کاتالوگ و مجموعه داده‌های باز و کاربردی که به ارائه داده‌ها به‌صورت باز می‌پردازند مورد بررسی قرار گرفته است و وضعیت هر سازمان با توجه به هر معیار که از مطالعات کتابخانه‌ای به‌دست آمده، مشخص‌ شده است. با توجه به اینکه تعداد سازمان‌های دولتی ارائه‌دهنده داده‌های باز در این سامانه 112 مورد بوده همه اعضای جامع آماری را شامل شده و مورد بررسی قرار گرفته است. سپس، با استفاده از روش‌های داده‌کاوی، ویژگی‌های داده‌های سازمان‌های با وضعیت مطلوب، مشخص‌ شده است. در فاز دوم، به استخراج عوامل و محرک‌های ترغیب‌کننده سازمان‌ها در ارائه داده‌ها به‌صورت باز براساس مطالعات کتابخانه‌ای پرداخته شده‌ است. همچنین با استفاده از روش میدانی و تکنیک‌های تصمیم‌گیری چندمعیاره،[2] وزن و اهمیت هر معیار محاسبه شده‌ است.

ازاین‌رو پژوهش‌های مرتبط، معایب و محدودیت‌های آنها و دلایل پرداختن به پژوهش جاری ارائه‌ شده است. همچنین در ادامه روش پژوهش مطرح شده که شامل فازهای نحوه افزایش مشارکت شهروندان در استفاده از داده‌های دولتی باز و عوامل و محرک‌های ترغیب‌کننده سازمان‌های دولتی در ارائه داده‌ها به‌صورت باز، بیان شده‌ است. سپس به نتایج و بحث درخصوص یافته‌ها پرداخته شده‌ و درنهایت در بخش پایانی به نتیجه‌گیری مطالب گفته شده می‌پردازد.

۱. پیشینه پژوهش

در این بخش به پژوهش‌های مرتبط با عوامل و محرک‌ها در افزایش مشارکت سازمان‌ها و شهروندان در ارائه و استفاده از داده‌های دولتی باز پرداخته شده‌ است. جدول 1، پژوهش‌های مرتبط را براساس نام پژوهشگران، سال انتشار، عنوان پژوهش، شرح مختصر و نتایج نشان‌ می‌دهد.

جدول 1. پژوهش‌های پیشین، شرح مختصر و نتایج

نتایج

شرح مختصر

سال انتشار

نام پژوهشگران

عنوان پژوهش

براساس نتایج این پژوهش، عدم تعامل بین کاربران با پورتال‌های داده‌های دولتی باز در مواردی مانند ارائه بازخورد یا درخواست مجموعه داده از مشکلات اصلی پورتال‌های داده‌های دولتی باز است که سبب کاهش مشارکت شهروندان در استفاده از داده‌های دولتی باز شده‌ است.

قابلیت استفاده از داده‌های ارائه‌ شده 41 پورتال داده دولتی باز براساس بازخورد 40 کاربر بررسی شده‌ است.

2021

نیکیفوروا و امسی برآید[3]

قابلیت استفاده از پورتال داده‌های دولتی باز: تحلیل کاربر محور 41 پورتال داده‌های دولتی باز

براساس یک تحلیل هفت مرحله‌ای، یک چارچوب مرجع مشترک برای ارزیابی کیفیت داده‌های دولتی باز ارائه شده است که شامل شش معیار دقت، دسترسی، کامل بودن، به‌موقع بودن، ثبات و قابل درک بودن است. بهبود وضعیت سازمان‌ها براساس معیارهای بیان‌شده می‌تواند سبب افزایش مشارکت شهروندان در استفاده از داده‌های دولتی باز شود.

یک چارچوب مرجع مشترک برای ارزیابی کیفیت داده‌های دولتی باز ارائه شده است.

2020

ژنگ و ژیائو[4]

چارچوب ارزیابی کیفیت داده‌های دولتی باز (تجزیه و تحلیل تحقیقات کیفی، 2009-2019)

ابعاد مشخص‌ شده عبارتند از: غنای اطلاعاتی، قابلیت کشف، قابلیت استفاده مجدد و تعامل.

مدل ارزیابی پیشنهادی برای انجام ارزیابی چهار پورتال داده‌های دولتی باز ملی استفاده شده است.

یک مدل ارزیابی برای پورتال‌های داده‌های دولتی باز براساس چند بعد اصلی که تأثیر زیادی بر مشارکت شهروندان در استفاده از داده‌های دولتی باز دارد، مشخص شده است.

2018

دهبی و همکاران[5]

مدل ارزیابی پورتال‌های داده دولتی باز

نویسندگان پیشنهاد می‌کنند که مجموعه داده‌ها از نظر کامل بودن، دقت، قابل ردیابی بودن، قابل فهم بودن، انطباق و انقضا ارزیابی شوند.

رویکردی برای اندازه‌گیری و بهبود کیفیت مجموعه داده‌های دولتی باز به‌منظور افزایش مشارکت و استفاده شهروندان از داده‌ها ارائه شده است.

2016

وترو و همکاران[6]

چارچوب اندازه‌گیری کیفیت داده‌های باز: تعریف و کاربرد برای داده‌های دولتی باز

نتایج نشان داد که آمادگی سازمانی و فشارهای خارجی دارای رابطه مثبت با انتشار داده‌ها توسط سازمان‌ها است.

معیارهای تأثیرگذار بر مشارکت آژانس‌های دولتی تایوان در ارائه داده‌های دولتی به‌صورت باز مورد بررسی قرار گرفته است.

2016

وانگ و لو[7]

داده‌های دولتی باز در بین سازمان‌های دولتی

گزارش شده‌ است که درک مفید بودن، توانایی سازمانی، نفوذ خارجی و شرایط تسهیل‌کننده بر قصد سازمان‌های دولتی در انتشار داده‌ها تأثیر مثبت می‌گذارد.

از نظریه‌ها و عوامل اجتماعی و فنی در انتشار داده‌های باز در بین سازمان‌های دولتی تایوان الگو گرفته شده‌ است.

2016

یانگ و وو[8]

بررسی عوامل تعیین‌کننده فنی و اجتماعی تأثیرگذار بر انتشار داده‌های باز سازمان‌های دولتی

همان‌طور که در پیشینه پژوهش ملاحظه می‌شود، هریک از پژوهش‌های انجام شده بر بعد خاصی از بهبود کیفیت داده‌های دولتی باز و افزایش تمایل شهروندان در استفاده از داده‌ها تمرکز کرده‌اند. همچنین، وزن و اهمیت هریک از این ابعاد و معیار‌ها مشخص نشده است. در نظر گرفتن وزن و اهمیت هریک از این ابعاد و معیار‌ها براساس میزان تمایلی که شهروندان تاکنون از داده‌ها داشتند، در پژوهش‌های پیشین مورد توجه قرار نگرفته‌ است. تعیین وضعیت سازمان‌ها براساس معیارهای استخراج‌ شده و استفاده از این اطلاعات به‌منظور خوشه‌بندی سازمان‌ها با وضعیت مشابه و ایجاد یک مدل طبقه‌بندی[9] به‌منظور پیش‌بینی و کنترل وضعیت سازمان‌ها انجام نشده است. ازاین‌رو در این پژوهش، پس از استخراج معیارهای جامع تأثیرگذار در مشارکت شهروندان در استفاده از داده‌های دولتی باز براساس مطالعات کتابخانه‌ای، به تعیین وضعیت سازمان‌ها براساس هر معیار پرداخته است. سپس با استفاده از روش‌های داده‌کاوی و مدل رگرسیون، ویژگی‌ داده‌های سازمان‌های با وضعیت مطلوب، استخراج‌ شده است. همچنین به خوشه‌بندی سازمان‌ها و تخصیص برچسب به هر خوشه، برای ایجاد یک مدل طبقه‌بندی به‌منظور پیش‌بینی و کنترل وضعیت سازمان‌های ارائه‌دهنده داده‌های دولتی باز پرداخته شده‌ است. علاوه بر این، عوامل و محرک‌های تأثیرگذار بر سازمان‌های دولتی در ارائه داده‌ها به‌صورت باز و وزن و اهمیت هر عامل استخراج و محاسبه شده‌ است.

۲. روش پژوهش

در این پژوهش، نوع تحقیق برمبنای هدف از نوع تحقیقات کاربردی است. شکل 1، فرایند تحقیق شامل فازهای افزایش مشارکت شهروندان در استفاده از داده‌های دولتی باز و افزایش مشارکت سازمان‌های دولتی در ارائه داده‌ها به‌صورت باز را نشان‌ می‌دهد.

 

شکل 1. فرایند تحقیق

 

مأخذ: یافته‌های تحقیق.

روش پژوهش، به تفکیک هریک از فازهای افزایش مشارکت شهروندان در استفاده از داده‌های دولتی باز و افزایش مشارکت سازمان‌های دولتی در ارائه داده‌ها بیان‌ شده است.

۲-۱. افزایش مشارکت شهروندان در استفاده از داده‌های دولتی باز

در این فاز به افزایش مشارکت شهروندان در استفاده از داده‌های دولتی باز به‌منظور تحقق حکمرانی مشارکتی و مردمی و بهره بردن از مزایای ذکر شده آن پرداخته شده‌ است. این فاز شامل چهار گام استخراج معیارهای مربوط به داده‌های باز و تأثیرگذار در مشارکت شهروندان در استفاده از داده‌ها، تعیین وضعیت هر سازمان براساس معیارهای استخراج شده، استخراج ویژگی‌های داده‌های باز سازمان‌های با وضعیت مطلوب و ایجاد یک مدل طبقه‌بندی است که هریک در ادامه توضیح داده شده‌ است.

۲-۱-۱. استخراج معیارهای مربوط به داده‌های باز و تأثیرگذار در مشارکت شهروندان

در این بخش، معیارهای مربوط به داده‌های باز که در مشارکت شهروندان تأثیرگذارند استخراج شده است. بدین‌منظور با مطالعات کتابخانه‌ای، جامعه آماری شامل همه مقالات مرتبط با ابعاد و معیار‌های مؤثر در افزایش مشارکت و تمایل شهروندان است. همچنین از روش نمونه‌گیری احتمالی از نوع نمونه‌های تصادفی ساده استفاده شده و 15 مقاله در این حوزه مورد بررسی قرار گرفته است.

۲-۱-۲. تعیین وضعیت هر سازمان براساس معیارهای استخراج شده

پس از استخراج معیارهای مربوط به داده‌های دولتی باز که در مشارکت شهروندان مؤثر است، سازمان‌ها، شامل تمامی سازمان‌ها و مؤسسه‌های دولتی حاضر در سامانه ملی کاتالوگ و مجموعه داده‌های باز و کاربردی[10] که به ارائه داده‌ها به‌صورت باز می‌پردازند مورد بررسی قرار گرفته‌اند و اطلاعات مرتبط با هر معیار که در بخش پیش استخراج شده‌اند، برای هر سازمان محاسبه شده‌ است. با توجه به اینکه تعداد سازمان‌های دولتی ارائه‌دهنده داده‌های باز در این سامانه 112 مورد بوده، اعضای جامع آماری شامل تمامی سازمان‌ها و از نمونه‌گیری استفاده نشده است.

۲-1-3. استخراج ویژگی‌های داده‌های باز مورد استقبال شهروندان

در این بخش به تجزیه و تحلیل شبکه پیچیده شهروندان، سازمان‌ها و مؤسسه‌های دولتی ارائه‌دهنده داده‌های باز پرداخته شده‌ است. این شبکه جهت‌دار است و گره‌ها در این شبکه؛ شهروندان، سازمان‌ها و مؤسسه‌های دولتی هستند و لینک‌ها، بازدید از داده‌ها را نشان می‌دهد. به‌عنوان مثال در شکل 2، شبکه‌ای از شهروندان و سازمان‌های ارائه‌دهنده داده‌های دولتی باز نشان داده شده‌ است. لینک که از شهروند i به سازمان j متصل شده‌ است، نشان می‌دهد که شهروند i از داده‌های منتشر شده به‌صورت باز سازمان j بازدید کرده است. در این شبکه، لینک‌های جهت‌دار از شهروند به سازمان یا سازمان به سازمان دیگر می‌تواند وجود داشته باشد. اما امکان لینک جهت‌دار بین شهروندان یا سازمان به شهروند در این شبکه وجود ندارد. همچنین امکان ایجاد لینک از یک شهروند به چندین سازمان وجود دارد، یعنی یک شهروند می‌تواند از داده‌های چندین سازمان بازدید کند.

شکل ۲. شبکه پیچیده شهروندان، سازمان‌ها و مؤسسه‌های دولتی

 

مأخذ: همان.

از مرکزیت درجه به‌منظور شناسایی سازمان‌هایی که داده‌های آنها مورد تمایل بیشتری قرار گرفته‌اند، استفاده‌ شده است. مرکزیت درجه مطلق گره vi از طریق رابطه 1 محاسبه می‌شود (Estrada, 2021):

(1)

cD (i) = degree of vertex i

مرکزیت درجه نسبی گره vi از طریق رابطه 2 قابل محاسبه است. n-1 بزرگ‌ترین درجه ممکن یک شبکه با n گره است.

 (۲)

CD (i) = cD (i)/(n-1)

این اطلاعات از طریق سامانه ملی کاتالوگ و مجموعه داده‌های باز و کاربردی براساس میزان بازدیدی که از مجموعه داده‌های باز هر سازمان انجام شده، قابل استخراج است.

از تکنیک‌های داده‌کاوی به‌منظور استخراج ویژگی‌های داده‌های سازمان‌هایی که مورد تمایل بیشتری بودند (درجه مرکزیت بالاتری داشتند)، از مدل رگرسیون استفاده شده است. از معیار‌های استخراج شده (در بخش ۱-۱-۲)، به‌عنوان صفات خاصه و از داده‌ها  (بخش 2-۱-۲) که داده‌های سازمان‌ها براساس هر معیار است، به‌عنوان رکورد استفاده شده است. صفت خاصه «میزان بازدید» به‌عنوان برچسب[11] آمده است. خروجی این مدل، ضرایب مرتبط با هر معیار است که وزن و اهمیت آن معیار را مشخص می‌کند.

۲-۱-۴. ایجاد مدل طبقه‌بندی

در این بخش به ایجاد یک مدل طبقه‌بندی، برای پیش‌بینی وضعیت سازمان‌ها و همچنین چگونگی مدیریت و کنترل سازمان‌ها به‌منظور دستیابی به وضعیتی پرداخته شده‌ که داده‌های آنها مورد استقبال بیشتر شهروندان قرار گیرد. بدین‌منظور در ابتدا از روش‌های داده‌کاوی، شامل خوشه‌بندی به‌منظور شناسایی سازمان‌ها با وضعیت مشابه و تخصیص برچسب به هر سازمان استفاده‌ شده سپس، به ایجاد مدل طبقه‌بندی درخت تصمیم[12] براساس برچسب‌های مشخص شده پرداخته شده‌ است. همچنین از ماتریس درهم‌ریختگی[13] و استفاده از معیارهایی مانند دقت[14]، برای ارزیابی مدل طبقه‌بندی ایجاد شده استفاده‌ شده است.

۲-۲. افزایش مشارکت سازمان‌های دولتی در ارائه داده‌ها به‌صورت باز

در این فاز به افزایش مشارکت سازمان‌های دولتی در ارائه داده‌ها به‌صورت باز به‌منظور تحقق حکمرانی مشارکتی و مردمی و بهره بردن از مزایای ذکر شده آن پرداخته شده‌ است. این فاز شامل دو گام استخراج عوامل و محرک‌های سازمان‌های دولتی در ارائه داده‌ها به‌صورت باز و محاسبه وزن و اهمیت هریک از عوامل است. این دو گام در ادامه توضیح داده‌ شده‌ است.

۲-۲-۱. استخراج عوامل و محرک‌های سازمان‌های دولتی در ارائه داده‌ها به‌صورت باز

در این فاز به استخراج عوامل و محرک‌ها در ترغیب سازمان‌های دولتی در ارائه داده‌ها به‌صورت باز مطالعات کتابخانه‌ای استفاده شده است.

۲-۲-۲. محاسبه وزن و اهمیت عوامل و محرک‌های سازمان‌های دولتی در ارائه داده‌ها به‌صورت باز

پس از استخراج عوامل و محرک‌هایی که سبب مشارکت بیشتر سازمان‌های دولتی در ارائه داده‌ها به‌صورت باز می‌شود، به محاسبه وزن و اهمیت هریک از این عوامل با استفاده از روش میدانی و تکنیک‌های تصمیم‌گیری چندمعیاره شامل تکنیک تحلیل سلسله‌مراتبی[15] پرداخته شده‌ است.

۳. یافته‌های پژوهش

در این بخش به نتایج و یافته‌های حاصل از اعمال روش پیشنهادی شامل فازهای افزایش مشارکت شهروندان در استفاده از داده‌های دولتی باز و افزایش مشارکت سازمان‌های دولتی در ارائه داده‌ها به‌صورت باز به‌منظور تحقق حکمرانی مشارکتی و مردمی و بهره بردن از مزایای ذکر شده آن پرداخته شده‌ است.

۳-۱. افزایش مشارکت شهروندان در استفاده از داده‌های دولتی باز

۳-۱-۱. استخراج معیارهای مربوط به داده‌های باز و تأثیرگذار در مشارکت شهروندان

ابعاد و معیارهای استخراج‌ شده به‌همراه مرجع مربوطه در ادامه بیان‌ شده است.

۳-۱-۱-۱. باز بودن داده

  1. دقت داده‌ها (Veljković, Bogdanović-Dinić and Stoimenov, 2014; Dahbi, Lamharhar and Chiadmi, 2018): این بعد با اصالت داده‌ها، عدم داده‌های از دست رفته و به‌روز بودن داده‌ها سروکار دارد. معیار‌های مرتبط با بعد دقت داده‌ها عبارتند از:

الف) اصالت داده‌ها (Veljković, Bogdanović-Dinić and Stoimenov, 2014; Vetro etal., 2016)

ب) عدم وجود داده‌های از دست رفته (Dahbi, Lamharhar and Chiadmi, 2018)

  • به‌روز بودن (سایت داده باز جهانی[16](Veljković, Bogdanović-Dinić and Stoimenov, 2014; Dahbi, Lamharhar and Chiadmi, 2018; Huang etal., 2019) : این معیار، به‌روز بودن داده‌ها را براساس فراداده زمانی به‌ویژه تاریخ ایجاد مجموعه داده و تاریخ به‌روزرسانی مجموعه داده‌ها مورد سنجش قرار می‌دهد. نمره هر سازمان Oi براساس داده‌هایی که در پنج سال اخیر منتشر کرده است (Tj داده‌هایی که در j سال پیش منتشر شده‌ است) با استفاده از رابطه 3 محاسبه می‌شود.

(۳)

Oi = ) Tj

  1. قابل کشف بودن (Dahbi, Lamharhar and Chiadmi, 2018; Attard etal., 2015): قابلیت کشف با ابزارها و مکانیزمی که دسترسی و پیمایش داده‌ها را افزایش می‌دهند، سروکار دارد. معیار‌های مرتبط با بعد قابل کشف بودن عبارتند از:

الف) کامل بودن فراداده (Dahbi, Lamharhar and Chiadmi, 2018; Zheng etal., 2020; Huang etal., 2019; Saxena, 2018): این معیار کامل بودن فراداده توصیفی را ارزیابی می‌کند که شامل عنوان، توضیحات، برچسب‌ها، ناشر و غیره برای هر مجموعه داده است.

  • میزان دسترسی به داده (Dahbi, Lamharhar and Chiadmi, 2018; Zheng etal., 2020; Huang etal., 2019; Vetro etal., 2016): این معیار وجود ویژگی‌هایی را ارزیابی می‌کند که کشف داده‌ها را افزایش می‌دهد، به‌ویژه وجود سه ویژگی: جستجو، مرتب‌سازی و فیلتر که مقادیر خود را در محدوده [0،1] با توجه به وجود این ویژگی‌ها دریافت می‌کنند.
  1. غنای اطلاعات:(Dahbi, Lamharhar and Chiadmi, 2018) غنای اطلاعات، رفع نیازهای کاربر را از نظر مقدار داده بررسی می‌کند. معیار‌های مرتبط با بعد غنای اطلاعات عبارتند از:

الف) تعداد مجموعه داده(Dahbi, Lamharhar and Chiadmi, 2018; Huang etal., 2019; Vetro etal., 2016; :Saxena, 2018) این معیار تعداد مجموعه داده‌هایی که یک سازمان به‌صورت باز ارائه کرده است را ارزیابی می‌کند.

  • تعداد دسته‌های داده (Saxena, 2018)
  • موضوع داده‌ها (Saxena, 2018): شهروندان ممکن است به برخی موضوع‌ها، تمایل بیشتری داشته باشند. براساس بررسی سامانه ملی کاتالوگ و مجموعه داده‌های باز و کاربردی، موضوع تمامی مجموعه داده‌های موجود استخراج شد که به شرح زیر است:

 

  1. ارتفاعات
  2. برنامه‌ریزی
  3. عوارض آبی
  4. زیست‌بوم جانوری و گیاهی
  5. مرزها
  6. تصاویر / نقشه‌های مبنایی / پوشش زمین
  7. موقعیت و مکان
  8. آب و هوا
  9. جامعه
  10. بهداشت
  11. مدیریت
  12. محیط زیست
  13. مزرعه‌داری
  14. آموزش علوم و تحقیقات
  15. انرژی
  16. سازه
  17. اقتصاد
  18. حمل‌و‌نقل
  19. علوم زمین

 

  • امکان درخواست داده (Dahbi, Lamharhar and Chiadmi, 2018; Zheng etal., 2020): این معیار میزان باز بودن، نسبت به درخواست کاربران را ارزیابی می‌کند. با توجه به امکان وجود درخواست داده، دو مقدار 1 یا 0 تعیین می‌شود.

۳-۱-۱-۲. شفافیت داده

  1. قابل استفاده مجدد بودن (Veljković, Bogdanović-Dinić and Stoimenov, 2014; Dahbi, Lamharhar and Chiadmi, 2018): قابلیت استفاده مجدد با ویژگی‌هایی سروکار دارد که راهی آسان برای استفاده مجدد از داده‌ها مانند برنامه‌ها و API (رابط برنامه‌نویسی برنامه) فراهم می‌کند. معیار‌های مرتبط با بعد قابل استفاده مجدد بودن عبارتنداز:

الف) باز بودن مجوز (سایت داده باز جهانی، ۲۰۱۸؛ (Veljković, Bogdanović-Dinić and Stoimenov, 2014; Dahbi, Lamharhar and Chiadmi, 2018): این معیار، باز بودن مجوز مجموعه داده برای استفاده مجدد را ارزیابی می‌کند.

  • باز بودن قالب (سایت داده باز جهانی، ۲۰۱۸ (Veljković, Bogdanović-Dinić and Stoimenov, 2014; Dahbi, Lamharhar and Chiadmi, 2018; Saxena, 2018; : این معیار باز بودن قالب منابع را ارزیابی می‌کند. برای هر مجموعه داده Dn، نمره FOIn براساس قالب منبع، به‌صورت زیر تخصیص می‌یابد:
    • اگر قالب غیرقابل خواندن توسط ماشین است: FOIn = 0 (به‌عنوان مثال PDF)
    • اگر قالب قابل خواندن توسط ماشین است: FOIn = 1 (به‌عنوان مثال JSON یا CSV)
      • رایگان بودن (سایت داده باز جهانی، ۲۰۱۸)
    • تبعیض‌آمیز نبودن :(Veljković, Bogdanović-Dinić and Stoimenov, 2014; Vetro etal.2016) امکان دسترسی و استفاده مجدد از داده‌ها برای تمامی افراد حقیقی و حقوقی یکسان باشد.
  1. قابل فهم بودن (Veljković, Bogdanović-Dinić and Stoimenov, 2014)

۳-۱-۱-۴. تعامل

  1. بازخوردپذیر Veljković, Bogdanović-Dinić and Stoimenov, 2019; Dahbi, Lamharhar and Chiadmi, 2018; Huang etal., 2019: این معیار وجود ویژگی‌های مربوط به همکاری، بازخورد و ارزیابی را بررسی می‌کند و وجود سه امکان را مورد سنجش قرار می‌دهد: اظهارنظر در مورد مجموعه داده‌ها، رتبه‌بندی مجموعه داده‌ها، بازخورد درباره پورتال.
  2. تجسمی بودنHuang etal., 2019; Saxena, 2018) :(Dahbi, Lamharhar and Chiadmi, 2018; این معیار وجود ابزارها و ویژگی‌های تجسم مانند نقشه‌ها، نمودارها یا برنامه‌ها را برای تجسم و تعامل با داده‌ها ارزیابی می‌کند.

۳-۱-۲. تعیین وضعیت سازمان‌ها براساس معیار‌های استخراج شده

شکل 3، نمایی از اطلاعات استخراج شده سازمان‌ها و مؤسسه‌های دولتی حاضر در سامانه ملی کاتالوگ و مجموعه داده‌های باز و کاربردی براساس معیار‌های بیان شده را نشان می‌دهد.

شکل 3. نمایی از اطلاعات استخراج شده سازمان‌ها براساس هر معیار

 

 

مأخذ: همان.

۳-۱-۳. استخراج ویژگی‌های داده‌های باز مورد استقبال شهروندان

۳-۱-۳-۱. تجزیه و تحلیل شبکه پیچیده شهروندان، سازمان‌ها و مؤسسه‌های دولتی

در این بخش، شبکه پیچیده شهروندان، سازمان‌ها و مؤسسه‌های دولتی حاضر در سامانه ملی کاتالوگ و مجموعه داده‌های باز و کاربردی، مورد بررسی قرار گرفتند. به‌منظور شناسایی سازمان‌ها و مؤسسه‌های دولتی با مرکزیت درجه بالا، لینک‌های ورودی از شهروندان به سازمان‌ها که نشان‌دهنده درجه ورودی[17] هر سازمان است، محاسبه شد. این اطلاعات براساس میزان بازدید از مجموعه داده‌های هر سازمان در سامانه ملی کاتالوگ و مجموعه داده‌های باز و کاربردی، در دسترس بود. شکل 4، نمونه‌ای از استخراج میزان بازدید براساس مجموعه داده و سازمان انتخاب شده را نشان‌ می‌دهد.

شکل 4. نمونه‌ای از استخراج میزان بازدید براساس مجموعه داده و سازمان انتخاب شده

 

 

مأخذ: همان.

۳-۱-۳-۲. استفاده از تکنیک‌های داده‌کاوی به‌منظور محاسبه وزن و اهمیت هر معیار

همان‌طور که پیش‌تر بیان شد در این بخش، قصد داریم وزن و اهمیت هر معیار را براساس میزان تمایلی محاسبه کنیم که شهروندان تاکنون از مجموعه داده‌های هر سازمان داشته‌اند. بدین صورت که مجموعه داده‌های سازمان‌های با وضعیت مطلوب که مورد تمایل بیشتر شهروندان بوده است، مشخص شوند. سپس ویژگی‌های این مجموعه داده‌ها استخراج و بر این اساس وزن و اهمیت هر معیار تعیین شود. بنابراین معیار‌های استخراج‌ شده، به‌عنوان صفات خاصه در نظر گرفته شده‌اند. رکوردها شامل داده‌های استخراج‌ شده هر سازمان براساس این معیارها هستند. از صفت خاصه میزان بازدید به‌عنوان برچسب استفاده شده است. همچنین نام سازمان‌ها و مؤسسه‌های دولتی به‌عنوان آی‌دی در نظر گرفته شده‌ است. در این بخش، از مدل رگرسیون به‌منظور تجزیه و تحلیل داده‌ها و محاسبه وزن و اهمیت هر معیار استفاده‌ شده است. خروجی این مدل، ضرایبی است که وزن و اهمیت هر معیار را مشخص می‌کند. بدین‌منظور از نرم‌افزار رپیدماینر[18] استفاده‌ شده است. شکل 5، اپراتورهای استفاده‌ شده در این نرم‌افزار را نشان‌ می‌دهد.

شکل 5. اپراتورهای استفاده شده در نرم‌افزار رپیدماینر به‌منظور محاسبه ضرایب رگرسیون

 

 

مأخذ: همان.

از اپراتور تقسیم داده[19] به‌منظور تقسیم داده‌ها به دو مجموعه داده‌های آموزش و تست استفاده شده است. 70 درصد داده‌ها به‌عنوان داده‌های آموزش و 30 درصد باقی‌مانده به‌عنوان داده‌های تست در نظر گرفته شد. شکل 6، داده‌های آموزش شامل صفات خاصه، رکوردها، آی‌دی و برچسب را نشان می‌دهد. تعداد داده‌های آموزش، 78 مورد بود که به‌صورت تصادفی از کل 112 مورد موجود انتخاب شدند.

شکل ۶. داده‌های آموزش

 

مأخذ: همان.

از اپراتور رگرسیون خطی[20] به‌منظور تحلیل داده‌ها و محاسبه ضرایب رگرسیون استفاده شده است. شکل 7، ضرایب محاسبه شده را نشان می‌دهد. علامت مثبت، تأثیر مثبت معیار مشخص شده را در برچسب نشان‌ می‌دهد که میزان بازدید شهروندان از مجموعه داده‌ها است. هرچه ضریب یک معیار، مثبت و بزرگ‌تر باشد، آن معیار، تأثیر بیشتری در افزایش میزان بازدید شهروندان از داده‌های دولتی باز دارد. علامت منفی، نشان‌دهنده تأثیر منفی معیار مشخص شده در میزان بازدید است. هرچه ضریب یک معیار، منفی و بزرگ‌تر باشد، آن معیار، تأثیر بیشتری در کاهش میزان بازدید شهروندان از داده‌های دولتی باز دارد.

شکل 7. ضرایب رگرسیون مرتبط با هر معیار

 

مأخذ: همان.

 

همان‌طور که در شکل 7 مشاهده می‌شود، معیار «موضوع جامعه» با دارا بودن ضریب ۵۶۴/۷۲ و علامت مثبت، بیشترین تأثیر را در برچسب داشته است که میزان بازدید شهروندان از داده‌های دولتی باز است. بدین‌معنا که شهروندان به مجموعه داده‌هایی که دارای موضوع جامعه هستند، تمایل بیشتری داشتند. پس از آن، معیار «باز بودن قالب» با دارا بودن ضریب ۶۸۲/۵۲ و علامت مثبت، رتبه دوم را در افزایش میزان بازدید داشته است. لذا شهروندان به مجموعه داده‌هایی که قابلیت خواندن توسط ماشین را دارند، تمایل بیشتری داشتند. معیار‌های «کامل بودن فراداده»، «تعداد مجموعه داده»، «قابل فهم بودن»، «اصالت داده‌ها»، «رایگان بودن»، «عدم داده‌های از دست رفته»، «تبعیض‌آمیز نبودن» و «باز بودن مجوز» با دارا بودن علامت مثبت، به‌ترتیب رتبه‌های بعدی در افزایش میزان بازدید شهروندان از داده‌های دولتی باز را کسب کردند. نکته‌ای که حائز اهمیت است، اینکه معیار «تعداد دسته‌های داده» دارای علامت منفی است، بدین‌معنا که شهروندان تمایل بیشتر به مجموعه داده‌هایی داشته‌اند که تمرکز بیشتر روی یک موضوع خاص دارد. همچنین «موضوع مزرعه‌داری» با دارا بودن علامت منفی و ضریب ۴۱۳/۱۶۰ بیشترین تأثیر منفی را در بازدید شهروندان از داده‌های دولتی باز داشته است. بدین‌معنا که شهروندان به بازدید از مجموعه داده‌های با موضوع مزرعه‌داری تمایلی نداشته‌اند.

            به‌منظور ارزیابی مدل رگرسیون ایجاد شده و اطمینان از ضرایب به‌دست آمده، از داده‌های تست استفاده شد. از 30 درصد کل داده‌ها به‌عنوان داده‌های تست مورد استفاده قرار گرفت. تعداد داده‌های تست، 78 مورد بود که به‌صورت تصادفی از کل 112 مورد موجود انتخاب شدند. شکل 8، داده‌های تست با میزان پیش‌بینی شده برای برچسب که میزان بازدید است با استفاده از مدل رگرسیون ایجاد شده را نشان می‌دهد. همچنین میزان واقعی بازدید نیز نشان داده شده‌ است.

شکل 8. داده‌های تست بههمراه مقدار پیش‌بینی شده برای برچسب و مقدار واقعی برچسب

 

مأخذ: همان.

از خطای جذر میانگین مربعات[21] به‌عنوان ارزیابی مدل رگرسیون ایجاد شده استفاده شد که برابر مقدار ۴۳۵/۱۹۹۸ بود. با توجه به خطای جذر میانگین مربعات به‌دست آمده، مقدار خطای جذر میانگین مربعات نرمال شده[22] برابر ۰۱۴/۰ (1.4 درصد) بود که طبق نوشته فو[23] (2005) چون کمتر از 10 درصد است، نشانگر وضعیت مطلوب مدل رگرسیون ایجاد شده‌ است.

۳-۱-۴. پیش‌بینی و کنترل وضعیت سازمان‌ها

۳-۱-۴-۱. خوشه‌بندی

به‌منظور شناسایی سازمان‌ها و مؤسسه‌های دولتی با وضعیت مشابه، تخصیص برچسب به هر خوشه و ایجاد یک مدل طبقه‌بندی به‌منظور پیش‌بینی و کنترل وضعیت سازمان‌ها، از خوشه‌بندی استفاده‌ شده است. برای این کار در ابتدا نیاز است تعداد خوشه‌های بهینه مشخص شود. بدین‌منظور از کدنویسی در R استفاده شده که در ادامه توضیح داده‌ شده‌ است.

الف) تعیین تعداد خوشه‌های بهینه

به‌منظور شناسایی تعداد خوشه‌های بهینه از کدنویسی در R و کتابخانه NbClust استفاده‌ شده است. معیارهاSilhouette ، Elbow، Gap Statistic و Pseudo بودند. اکثر معیارها، سه خوشه را به‌عنوان تعداد خوشه بهینه پیشنهاد دادند.

ب) الگوریتم خوشه‌بندی

در این بخش به اعمال الگوریتم خوشه‌بندی بر داده‌های استخراج‌ شده سازمان‌ها براساس هر معیار، پرداخته شده‌ است. به‌دلیل حساس بودن الگوریتم K-means به داده‌های پرت[24] از الگوریتم K-medoids استفاده‌ شده است. بدین‌منظور نرم‌افزار رپیدماینر مورد استفاده قرار گرفته است. پس از استفاده از الگوریتم K-medoid، سه خوشه شامل خوشه 0، خوشه 1 و خوشه 2 تشکیل شدند و سازمان‌ها براساس شباهت‌شان به یکدیگر در این خوشه‌ها قرار گرفتند.

ج)تخصیص برچسب به هر خوشه

به‌منظور تخصیص برچسب به هر خوشه، از صفت خاصه «میزان بازدید» استفاده شده است. این صفت خاصه، میزان بازدید شهروندان از داده‌های دولتی باز هر سازمان را نشان می‌دهد. برچسب‌های در نظر گرفته شده و تعداد سازمان‌ها و مؤسسه‌های مرتبط با هر برچسب در جدول 2 مشخص شده است.

جدول 2. برچسب‌های تخصیص‌یافته به هر خوشه و تعداد سازمان‌های مرتبط با هر برچسب

تعداد سازمان‌ها با برچسب مشخص شده

تعریف برچسب

برچسب

خوشه

2

میزان بازدید بالاتر از 10000

بازدید بالا (HV)

خوشه 0

74

میزان بازدید بین 100 تا 10000

بازدید متوسط (MV)

خوشه 1

36

میزان بازدید کمتر از 100

بازدید پایین (LV)

خوشه 2

مأخذ: یافته‌های تحقیق.

۳-۱-۴-۲. مدل طبقه‌بندی

الف) ایجاد مدل طبقه‌بندی درخت تصمیم

پس از برچسب‌گذاری، به ایجاد مدل طبقه‌بندی درخت تصمیم با استفاده از نرم‌افزار رپیدماینر پرداخته شد. در این مدل، از 80 درصد داده‌ها به‌عنوان داده‌های آموزش استفاده شد و 20 درصد باقی‌مانده به‌عنوان داده‌های تست در نظر گرفته شد. شکل 9، درخت تصمیم ایجاد شده را نشان می‌دهد.

 

 

شکل 9. درخت تصمیم

 

 

مأخذ: همان.

با استفاده از درخت تصمیم ایجاد شده در شکل 9، می‌توان به پیش‌بینی وضعیت سازمان‌ها در ارائه داده‌های دولتی باز پرداخت. برای مثال اگر تعداد مجموعه داده‌ها کوچک‌تر از 7 و تعداد دسته‌های داده بزرگ‌تر از 2 باشد، وضعیت سازمان برابر MV یعنی میزان بازدید متوسط خواهد بود. همچنین با استفاده از درخت تصمیم ایجاد شده می‌توان به کنترل وضعیت سازمان‌ها و بهبود وضعیت آنها در جهت افزایش مشارکت و استفاده شهروندان از داده‌های باز پرداخت. به‌عنوان مثال، اگر وضعیت یک سازمان برابر میزان بازدید کم باشد می‌توان با افزایش تعداد مجموعه داده‌ها، افزایش بصری‌سازی و دسترسی داده، آن را به وضعیت میزان بازدید متوسط سوق داد.

ب) ارزیابی مدل طبقه‌بندی ایجاد شده

در این بخش به ارزیابی مدل طبقه‌بندی ایجاد شده پرداخته شده‌ است. شکل 10، ماتریس درهم‌ریختگی درخت تصمیم ایجاد شده را نشان‌ می‌دهد.

شکل 10. ماتریس درهم‌ریختگی درخت تصمیم ایجاد شده

 

مأخذ: همان.

دقت مدل طبقه‌بندی ایجاد شده برابر ۹۱/۹۰٪ است که نشان از مطلوب بودن مدل دارد. همچنین مقادیر سایر معیارها مانند صحت[25] و پوشش[26] در شکل 10 نشان داده شده‌ است.

۳-۲. افزایش مشارکت سازمان‌های دولتی در ارائه داده‌ها به‌صورت باز

در این قسمت به نتایج حاصل از استخراج عوامل و محرک‌های سازمان‌های دولتی در ارائه داده‌ها به‌صورت باز و محاسبه وزن و اهمیت هر معیار پرداخته شده‌ است.

۳-۲-۱. استخراج عوامل و محرک‌های سازمان‌های دولتی در ارائه داده‌ها به‌صورت باز

اکثر چالش‌های موجود مانند به‌روز نبودن داده‌ها، کم بودن تعداد مجموعه داده‌های ارائه شده، عدم مواردی مانند تجسم داده‌ها و غیره در این است که سازمان‌های دولتی تمایلی برای به اشتراک‌گذاری داده‌های خود ندارند. در ادامه عوامل و محرک‌ها برای ترغیب سازمان‌های دولتی در اشتراک‌گذاری داده‌ها و درنتیجه بهبود حکمرانی مشارکتی و مردمی و بهره بردن از مزایای آن بیان شده است.

  1. نیاز به منابع انسانی (Zhenbin et al., 2020; Mergel, 2015; Tapscott, Williams and Herman, 2008) : منابع انسانی شامل نیروی انسانی، ایده‌ها، دانش و مهارت‌های مورد نیاز برای تحقق اهداف سازمان است. سازمان‌های دولتی به‌دنبال منابع انسانی و افراد هستند تا ایده‌هایی برای کمک به نوآوری خدمات عمومی ارائه دهند. لذا:
  • میزان نیاز نسبی به منابع انسانی با وابستگی سازمان دولتی به مبتکران خارجی رابطه مثبت دارد. هرچه این وابستگی بیشتر باشد، سازمان‌ها مجبور خواهند بود به ارائه داده‌های دولتی به‌صورت باز بیشتری برای جذب مبتکران خارجی بپردازند.
  1. نیاز به منابع مالی Taylor, 2018) (Zhenbin et al., 2020; Mohanty, Choppali and Kougianos, 2016;: ازآنجاکه سازمان‌های دولتی معمولاً منابع مالی محدود دارند، سرمایه‌گذاری در توسعه خدماتی که نیازهای مختلف مردم را برآورده می‌کند برای آنها می‌تواند چالش‌برانگیز باشد. بنابراین، سازمان‌های دولتی ممکن است به نوآوران خارجی برای کمک به منابع مالی وابسته باشند. لذا:
  • میزان نیاز به منابع مالی با وابستگی سازمان‌های دولتی به مبتکران خارجی ارتباط مثبت دارد. هرچه این وابستگی بیشتر باشد، سازمان‌ها مجبور خواهند بود برای جذب منابع از مبتکران خارجی، به ارائه داده‌های دولتی باز بیشتر بپردازند.
  1. نیاز به منابع فناوری اطلاعات(Zhenbin etal., 2020) : از‌آنجا‌که منابع داخلی فناوری اطلاعات ناکافی می‌تواند ارائه خدمات جدید بخش دولتی را محدود کند، بنابراین انتظار می‌رود که وابستگی سازمان‌های دولتی به منابع فناوری اطلاعات مبتکران خارجی افزایش یابد بنابراین:
  • میزان نیاز نسبی به منابع فناوری اطلاعات (از مبتکران خارجی) با وابستگی سازمان دولتی به مبتکران خارجی رابطه مثبت دارد. همچنین وابستگی سازمان‌های دولتی به مبتکران خارجی با عملکرد انتشار داده‌های باز آن نیز رابطه مثبت دارد.
  1. نیاز به تبعیت از مقامات بالاتر (Zheng et al. 3013; Zhenbin etal., 2020): یکی از عوامل اصلی در مشارکت سازمان‌های دولتی در ارائه داده‌های باز، مقامات بالاتر (به‌عنوان مثال، دولت‌های محلی و ملی) هستند که سیاست‌های رسمی و غیررسمی را برای تأثیرگذاری بر سازمان‌ها در به اشتراک گذاشتن داده‌ها اعمال می‌کنند. بنابراین:
  • نیاز تبعیت سازمان‌های دولتی از مقامات بالاتر با رفتار انتشار داده‌های باز آن ارتباط مثبت دارد.
  1. نیاز به ایجاد شفافیت (Zhenbin etal., 2020; Yu and Robinson, 2011): هنگامی که سازمان‌های دولتی داده‌های خود را از طریق ابتکارات داده‌های دولتی باز با مردم به اشتراک می‌گذارند، شهروندان و گروه‌های ذی‌نفع می‌توانند فعالیت‌های آنها را کنترل کرده و بدین‌ترتیب نیاز آنها را با شفافیت تأمین کنند. بنابراین:
  • نیاز سازمان‌های دولتی به شفافیت به‌طور مثبت با رفتار انتشار داده‌های باز آن ارتباط دارد.
  1. کاهش حساسیت عملیات کاری سازمان (Zhenbin etal., 2020; Appari and Johnson, 2010): برخی از سازمان‌های دولتی به‌دلیل عملیات کاری خود در دولت، اطلاعات حساسی را در اختیار دارند و پردازش می‌کنند که می‌تواند مشارکت داده‌های دولتی باز آنها‌ را محدود کند. بر این اساس، هرچه حساسیت عملیات کاری سازمان‌ها بیشتر باشد به اشتراک کمتر داده‌های آنها از طریق ابتکارات داده‌های دولتی باز منجر خواهد شد. لذا:
  • حساسیت عملیات کاری سازمان دولتی با رفتار اشتراک داده‌های باز آن رابطه منفی دارد.

۳-۲-۲. محاسبه وزن و اهمیت عوامل و محرک‌های سازمان‌های دولتی در ارائه داده‌ها به‌صورت باز

در این بخش به محاسبه وزن و اهمیت عوامل و محرک‌های ترغیب سازمان‌ها در ارائه داده‌ها به‌صورت باز براساس روش تحلیل سلسله‌مراتبی پرداخته شده‌ است. بدین‌منظور پرسشنامه‌ای طراحی شد و از خبرگان خواسته شد به مقایسه زوج عوامل بپردازند. نمودار 1، رتبه و وزن‌های حاصل از اعمال روش تحلیل سلسله‌مراتبی بر عوامل بیان شده را نشان می‌دهد. مجموع وزن‌ها برابر با 1 است. گفتنی است نرخ ناسازگاری، ۰۲۸/۰ بود که چون کمتر از ۱/۰ است، پایایی پرسشنامه‌ها را تأیید می‌کند.

 

نمودار ۱. وزن و اهمیت محرک‌های سازمان‌های دولتی در ارائه داده‌ها به‌صورت باز براساس روش تحلیل سلسلهمراتبی

 

مأخذ: همان.

براساس نتایج کسب شده، عوامل «نیاز به تبعیت از مقامات بالاتر» با وزن ۲۰۱/۰ «کاهش حساسیت عملیات کاری سازمان» با وزن ۱۸/۰ و «نیاز به منابع مالی» با وزن ۱۷۴/۰ به‌ترتیب سه رتبه نخست در بین عوامل و محرک‌ها در ترغیب سازمان‌ها به ارائه داده‌ها به‌صورت باز و بهبود حکمرانی مشارکتی و مردمی دارند.

۴. جمع‌بندی و نتیجه‌گیری

تحقق حکمرانی مشارکتی و بهره بردن از مزایای آن زمانی صورت‌ می‌گیرد که هم سازمان‌ها و مؤسسه‌های دولتی به ارائه داده‌های خود به‌صورت باز بپردازند و هم مردم از این داده‌ها برای ارائه نظرها و ایده‌ها و خلق ارزش استفاده کنند. ازاین‌رو در این پژوهش به بررسی عوامل و محرک‌های تأثیرگذار در مشارکت سازمان‌های دولتی در ارائه داده‌ها به‌صورت باز و مشارکت شهروندان در استفاده از داده‌ها پرداخته شد. در بخش افزایش مشارکت شهروندان در استفاده از داده‌های باز، هریک از پژوهش‌های صورت گرفته فقط بر بعد خاصی از داده‌های دولتی باز متمرکز شده‌اند و یک مجموعه معیار جامع و کامل وجود ندارد. به‌عنوان مثال در پژوهش نیکیفوروا و امسی‌برآید (2021)، فقط معیارهای امکان بازخورد و درخواست مجموعه داده به‌عنوان معیارهای تأثیرگذار در افزایش تمایل شهروندان در استفاده از داده‌ها در نظر گرفته شده‌ است. اما در این پژوهش، پس از مطالعات کتابخانه‌ای و بررسی مقالات مرتبط، معیار‌های جامع تأثیرگذار در افزایش تمایل شهروندان در استفاده از داده‌ها شامل «اصالت داده‌ها»، «باز بودن مجوز»، «به‌روز بودن»، «میزان دسترسی به داده»، «کامل بودن فراداده»، «تعداد مجموعه داده»، «باز بودن قالب»، «تبعیض‌آمیز نبودن»، «قابل فهم بودن»، «تعداد دسته‌های داده»، «رایگان بودن»، «عدم داده‌های از دست رفته»، «امکان درخواست داده»، «تجسمی بودن»، «بازخورد‌پذیر» و «موضوع مجموعه داده» ارائه شده است.

 مشکل دیگر موجود در پژوهش‌های پیشین این است که میزان اهمیت هر بعد و معیار، در نظر گرفته نشده است؛ به‌عنوان مثال در پژوهش ژنگ و ژیائو (2020)، شش معیار دقت، دسترسی، کامل بودن، به‌موقع بودن، ثبات و قابل درک بودن به‌عنوان معیارهای تأثیرگذار در استفاده از داده‌های دولتی باز بیان‌ شده است، اما مشخص نیست کدام معیارها اهمیت بالاتری دارند. همچنین در پژوهش وترو و همکاران (2016)، نویسندگان پیشنهاد می‌کنند که مجموعه داده‌ها از نظر کامل بودن، دقت، قابل ردیابی بودن، قابل فهم بودن، انطباق و انقضا ارزیابی شوند. با وجود جامع نبودن معیارهای ارائه شده، وزن و اهمیت این معیارها مشخص نیست. نکته مهم‌تر اینکه در هیچ‌یک از پژوهش‌های پیشین، وزن و اهمیت هر معیار، براساس تمایلی که تاکنون شهروندان از داده‌های دولتی باز مختلف داشته‌اند، محاسبه نشده است. نکات بیان‌شده، در این پژوهش مدّنظر قرار گرفته است و براساس نتایج به‌دست‌آمده، معیار «موضوع جامعه» با دارا بودن ضریب ۵۶۴/۷۲ و علامت مثبت، بیشترین تأثیر را در افزایش میزان بازدید شهروندان از داده‌های دولتی باز داشت. پس از آن، معیار «باز بودن قالب» با دارا بودن ضریب ۶۸۲/۵۲ و علامت مثبت، رتبه دوم را در افزایش میزان بازدید داشته است. معیار‌های «کامل بودن فراداده»، «تعداد مجموعه داده»، «قابل فهم بودن»، «اصالت داده‌ها»، «رایگان بودن»، «عدم داده‌های از دست رفته»، «تبعیض‌آمیز نبودن» و «باز بودن مجوز» با دارا بودن علامت مثبت، به‌ترتیب رتبه‌های بعدی را در افزایش میزان بازدید شهروندان از داده‌های دولتی باز کسب کردند. ضریب معیار «تعداد دسته‌های داده» دارای علامت منفی بود، بدین معنا که شهروندان تمایل بیشتر به مجموعه داده‌هایی داشته‌اند که تمرکز روی یک موضوع خاص دارد. همچنین «موضوع مزرعه‌داری» با دارا بودن علامت منفی و ضریب ۴۱۳/۱۶۰ بیشترین تأثیر منفی را در بازدید شهروندان از داده‌های دولتی باز داشته است.

 مسئله دیگر که در پژوهش‌های پیشین مورد توجه قرار نگرفته‌ است، عدم ارائه یک مدل طبقه‌بندی است. ارائه یک مدل طبقه‌بندی می‌تواند به پیش‌بینی و کنترل وضعیت سازمان‌های ارائه‌دهنده داده‌های دولتی باز به‌منظور افزایش مشارکت شهروندان در استفاده از داده‌ها و بهبود حکمرانی مشارکتی و مردمی کمک کند. در این پژوهش، به خوشه‌بندی سازمان‌ها، پرداخته شد. سپس با بررسی صفت خاصه میزان بازدید شهروندان از داده‌های دولتی باز هر سازمان، تخصیص برچسب به هر خوشه صورت گرفت. این برچسب‌ها نشان‌دهنده وضعیت هر سازمان است. پس از تخصیص برچسب به هر سازمان، به ارائه مدل طبقه‌بندی درخت تصمیم به‌منظور پیش‌بینی و کنترل وضعیت سازمان‌ها برای سوق دادن وضعیت آنها به وضعیت مطلوب پرداخته شد که افزایش مشارکت و استفاده شهروندان از داده‌های دولتی باز است.

 در بخش مربوط به عوامل و محرک‌های ترغیب‌کننده سازمان‌های دولتی در ارائه داده‌ها به‌صورت باز نیز به‌رغم کامل و جامع نبودن محرک‌های بیان شده در پژوهش‌های صورت‌ گرفته، وزن و اهمیت هر عامل محاسبه نشده است. به‌عنوان مثال در پژوهش یانگ و وو (2016)، تنها گزارش شده‌ است که درک مفید بودن، توانایی سازمانی، نفوذ خارجی و شرایط تسهیل‌کننده بر قصد سازمان‌های دولتی در انتشار داده‌ها تأثیر مثبت می‌گذارد. اما وزن و اهمیت هر عامل مشخص نشده است که در این پژوهش با استفاده از روش میدانی و استفاده از تکنیک‌های تصمیم‌گیری چندمعیاره به محاسبه اهمیت هر عامل پرداخته شد. براساس مطالعات و بررسی مقالات، 6 عامل شامل «نیاز به تبعیت از مقامات بالاتر»، «کاهش حساسیت عملیات کاری سازمان»، «نیاز به منابع مالی»، «نیاز به ایجاد شفافیت»، «نیاز به منابع انسانی» و «نیاز به منابع فناوری اطلاعات» استخراج شدند. در این پژوهش نیز با روش تحلیل سلسله‌مراتبی برای محاسبه وزن و اهمیت هر عامل استفاده شد و عوامل «نیاز به تبعیت از مقامات بالاتر» با دارا بودن وزن ۲۰۱/۰، «کاهش حساسیت عملیات کاری سازمان» با دارا بودن وزن ۱۸/۰ و «نیاز به منابع مالی» با دارا بودن وزن ۱۷۴/۰ به‌ترتیب سه رتبه نخست در بین عوامل و محرک‌های مؤثر در افزایش مشارکت سازمان‌های دولتی در ارائه داده‌ها به‌صورت باز را کسب کردند.

براساس نتایج و یافته‌های این پژوهش، می‌توان برخی از پیشنهادهای سیاستی زیر را به‌منظور افزایش تمایل سازمان‌ها در ارائه داده‌ها به‌صورت باز و افزایش مشارکت شهروندان در استفاده از داده‌های دولتی باز، به‌منظور تحقق حکمرانی مشارکتی و مردمی و بهره بردن از مزایای آن بیان کرد.

  • پیشنهادهای مربوط به افزایش تمایل سازمان‌ها در ارائه داده‌ها به‌صورت باز:
    • قوانینی برای تأثیرگذاری بر سازمان‌ها در به اشتراک گذاشتن داده‌ها به‌صورت باز تصویب شود.
    • سیاست‌هایی برای کاهش حساسیت عملیات کاری سازمان‌ها تعیین شود برای مثال سازمان‌هایی مانند بیمارستان‌ها که به اطلاعات بیماران مانند نام و کد ملی آنها دسترسی دارند، پس از جایگزینی این مشخصات با کدهایی، به ارائه این داده‌ها برای عموم پرداخته شود. قابل ذکر است با حذف این فیلدها، از ارزش داده‌ها کاسته نمی‌شود.
    • در نظر گرفتن تسهیلات به‌منظور افزایش شرکت‌های خصوصی که قصد سرمایه‌گذاری در حوزه‌های مختلف دارند تا بدین‌ترتیب سازمان‌ها، ترغیب به ارائه داده‌های خود به‌صورت باز برای جلب نظر شرکت‌های خصوصی و دریافت منابع مالی شوند.
    • آگاه کردن، تبلیغ و اطلاع‌رسانی درخصوص سازمان‌هایی که با دریافت ایده‌های شهروندان به پیشرفت‌های چشمگیری دست یافتند تا سبب ترغیب سازمان‌های دیگر در ارائه داده‌ها به‌صورت باز برای کسب منابع انسانی شود.
  • پیشنهادهای مربوط به افزایش تمایل شهروندان در مشارکت و استفاده از داده‌های دولتی باز:
    • سعی شود مجموعه داده‌هایی که مورد نیاز بیشتر مردم است مانند مجموعه داده‌های با موضوع جامعه‌شناسی بیشتر به‌صورت باز ارائه شود.
    • حتی‌المقدور داده‌های ارائه شده که به‌صورت باز دارای فرمت‌های قابل خواندن توسط ماشین مانند CSV، JSON و غیره باشد.
    • برای مجموعه داده‌هایی که به‌صورت باز ارائه می‌شود، فراداده‌هایی شامل عنوان، توضیحات، برچسب، ناشر و غیره فراهم شود.
    • پیش از ارائه داده‌ها به‌صورت باز از عدم داده‌های از دست رفته، اطمینان حاصل شود.
    • سعی شود داده‌ها به‌صورت دوره‌های متوالی به‌روز شود.
    • حتی‌المقدور سعی شود هر سازمان بر موضوع خاص مربوط به حیطه خود متمرکز شود و تعداد دسته‌های داده زیاد نباشد.

            اقدام‌‌های انجام شده و یافته‌های به‌دست‌آمده از این پژوهش، شامل استخراج معیار‌های جامع مربوط به داده‌های دولتی باز و مؤثر در افزایش مشارکت شهروندان در استفاده از داده‌ها، محاسبه وزن و اهمیت هر معیار با بررسی شبکه پیچیده شهروندان و سازمان‌ها، ارائه یک مدل طبقه‌بندی به‌منظور پیش‌بینی و کنترل وضعیت سازمان‌ها و همچنین ارائه عوامل و محرک‌های سازمان‌های دولتی در ارائه داده‌ها به‌صورت باز و محاسبه وزن و اهمیت هر عامل، می‌تواند به مدیران در تصمیم‌گیری و مدیریت صحیح به‌منظور بهبود حکمرانی مشارکتی و مردمی و درنتیجه بهره بردن از مزایای آن کمک کند.

[1] .Open Data

[2] .Multi-Criteria Decision Making (MCDM)

[3] .Nikiforova and McBride

[4] .Zhang and Xiao

[5] .Dahbi, Lamharhar and Chiadmi

[6] .Vetrò etal.

[7] .Wang and Lo

[8] .Yang and Wu

[9] .Classification Model

[10] .https://data.gov.ir/

[11] .Label

[12] .Decision Tree

[13] .Confusion Matrix

[14] .Accuracy

[15] .Analytical Hierarchy process (AHP)

[16] .https://index.okfn.org/place/

[17] .Indegree

[18] .Rapid Miner

[19] .Split Data

[20]. Linear Regression

[21] .Root Mean Square Error (RMSE)

[22] .Normal Root Mean Square Error (NRMSE)

[23] .Fu

[24] .Outlier

[25] .Precision

[26] .Recall

  1. امام‌جمعه‌زاده، سیدجواد (1395). «الگوی حکمرانی خوب؛ جامعه همکار و دولت کارآمد در مدیریت توسعه»، فصلنامه علوم سیاسی، 12 (36).
  2. ژاله باغبادرانی، معصومه، علی یعقوبی‌پور و علیرضا فتحی‌زاده (1400). «طراحی مدل حکمرانی مشارکتی در راستای کاهش فساد اداری با رویکرد آمیخته (مورد مطالعه: استانداری و فرمانداری شهر اهواز)»، فصلنامه علمی راهبرد، 30 (4).
  3. Appari, Ajit and M. Eric Johnson (2010). "Information Security and Privacy in Healthcare: Current State of Research", International Journal of Internet and Enterprise Management 6, No. 4.
  4. Attard, Judie, Fabrizio Orlandi, Simon Scerri and Sören Auer (2015). "A Systematic Review of Open Government Data Initiatives", Government Information Quarterly 32, No. 4.
  5. Dahbi, Kawtar Younsi, Hind Lamharhar and Dalila Chiadmi (2018). "Toward an Evaluation Model for Open Government Data Portals", In International Conference Europe Middle East & North Africa Information Systems and Technologies to Support Learning, Springer, Cham.
  6. Enders, Tobias, Carina Benz and Gerhard Satzger (2021). "Untangling the Open Data Value Paradox: How Organizations Benefit from Revealing Data", In International Conference on Wirtschaftsinformatik, Springer, Cham.
  7. Estrada, Ernesto (2012). The Structure of Complex Networks: Theory and Applications", Oxford University Press.
  8. Fu, Guobin (2005). Modeling Water Availability and its Response to Climatic Change for the Spokane River Watershed, Washington State University.
  9. Fu, Y. (2019). The Value of Corporate Governance: Evidence From the Chinese Anti-corruption Campaign", The North American Journal of Economics and Finance, 47.
  10. https://index.okfn.org/place/
  11. https://data.gov.ir/
  12. Huang, Ruhua, Chunying Wang, Xiaoyu Zhang, Dan Wu and Qingwen Xie (2019). "Design, Develop and Evaluate an Open Government Data Platform: A User-centred Approach", The Electronic Library, 37, No. 3.
  13. Mergel, Ines (2015). "Opening Government: Designing Open Innovation Processes to Collaborate With External Problem Solvers", Social Science Computer Review 33, No.
  14. Mohanty, Saraju P., Uma Choppali and Elias Kougianos (2016). "Everything you Wanted to Know About Smart Cities: The Internet of Things is the Backbone", IEEE Consumer Electronics Magazine 5, No. 3.
  15. Nikiforova, Anastasija and Keegan McBride (2021). "Open Government Data Portal Usability: A User-centred Usability Analysis of 41 Open Government Data Portals", Telematics and Informatics
  16. Saxena, Stuti (2018). "Open Government Data (OGD) In Six Middle East Countries: An Evaluation of the National Open Data Portals", Digital Policy, Regulation and Governance, 20 (2).
  17. Tapscott, Don, Anthony D. Williams and Dan Herman (2008). "Government 2.0: Transforming Government and Governance for the Twenty-first Century", New Paradigm
  18. Taylor, Simon Peter (2018). "Innovation in the Public Sector: Dimensions, Processes, Barriers and Developing a Fostering Framework", International Journal of Research Science & Management 5, No. 1.
  19. Veljković, Nataša, Sanja Bogdanović-Dinić and Leonid Stoimenov (2014). "Benchmarking Open Government: An Open Data Perspective", Government Information Quarterly 31, No. 2.
  20. Vetrò, Antonio, Lorenzo Canova, Marco Torchiano, Camilo Orozco Minotas, Raimondo Iemma and Federico Morando (2016). "Open Data Quality Measurement Framework: Definition and Application to Open Government Data", Government Information Quarterly 33, No. 2.
  21. Wang, H.J. and J. Lo (2016). "Adoption of Open Government Data Among Government Agencies", Government Information Quarterly, 33 (1).
  22. Yang, T.M. and Y.J. Wu (2016). "Examining the Socio-technical Determinants Influencing Government Agencies' Open Data Publication: A study in Taiwan", Government Information Quarterly, 33 (3).
  23. Yu, Harlan and David G. Robinson (2011). "The new Ambiguity of Open Government", UCLA L. Rev. Discourse
  24. Zhang, Hui and Jianying Xiao (2020). "Quality Assessment Framework for Open Government Data: Meta-synthesis of Qualitative Research, 2009-2019", The Electronic Library 38, No. 2.
  25. Zhenbin, Yang, Atreyi Kankanhalli, Sangwook Ha and Giri Kumar Tayi (2020). "What Drives Public Agencies to Participate in Open Government Data Initiatives? An Innovation Resource Perspective", Information & Management 57, No. 3.
  26. Zheng, Daqing, Jin Chen, Lihua Huang and Cheng Zhang (2013). "E-government Adoption in Public Administration Organizations: Integrating Institutional Theory Perspective and Resource-based View", European Journal of Information Systems 22, No. 2.
  27. Zheng, Lei, Wai-Min Kwok, Vincenzo Aquaro, Xinyu Qi and Wenzeng Lyu (2020). "Evaluating Global Open Government Data: Methods and Status", In Proceedings of the 13th International Conference on Theory and Practice of Electronic Governance.