Dữ liệu mở rất cần thiết cho chuyển đổi số ở Việt Nam, nhưng loại dữ liệu nào nên được mở?

04/08/2021 | Chính phủ số
Nếu dữ liệu được kết nối, chia sẻ, và cao hơn là mở có giấy phép thì có thể tiết kiệm các khoản chi phí không đáng có, tránh việc tình trạng ngân sách nhà nước phải chi trả 2 lần cho một tệp dữ liệu.
Dữ liệu mở rất cần thiết cho chuyển đổi số ở Việt Nam, nhưng loại dữ liệu nào nên được mở?

Chia sẻ


Dữ liệu mở không chỉ là thêm một kênh mới để cung cấp dữ liệu phục vụ người dân và doanh nghiệp mà còn tác động thay đổi nhận thức, quy trình quản trị của Chính phủ, củng cố niềm tin của xã hội và tạo nền tảng chuyển đổi số của đất nước.
Trong thời đại số, dưới tác động của sự phát triển nhanh chóng của khoa học và công nghệ, mọi quốc gia, tổ chức đến từng cá nhân đều đang chạy đua trên hành trình chuyển đối số. Trên hành trình này, mỗi bước chạy đều tạo ra những dữ liệu bổ sung vào kho dữ liệu số khổng lồ. Bởi vậy, dữ liệu đang dần được coi là nguồn tài nguyên có giá cho mọi sự cải tiến và phát triển. Để tận dụng hết giá trị và tiềm năng của kho dữ liệu hiện có, một vài loại dữ liệu cần thiết phải được mở cho công chúng tiếp cận, sử dụng và khai thác.
Lợi ích của “dữ liệu mở”
Hiện nay, Chính phủ đã và đang có nguồn tài nguyên dữ liệu khổng lồ, phần lớn trong số đó là những dữ liệu có thể công khai theo luật. Với những loại dữ liệu này, chúng có thể được mở ra và có tính sẵn sàng cho mọi người sử dụng.
Việc không kết nối, liên thông dữ liệu có thể dẫn đến tình trạng ngân sách nhà nước phải chi trả 2 lần cho một tệp dữ liệu, tức là một cơ quan chi ngân sách để xây dựng tệp dữ liệu và cơ quan khác phải dùng khoản ngân sách khác để mua dữ liệu đó. Vì vậy, nếu dữ liệu được kết nối, chia sẻ, và cao hơn là mở có giấy phép cho công chúng thì các cơ quan của Chính phủ có thể tiết kiệm các khoản chi phí không đáng có.
Không chỉ giúp tiết kiệm ngân sách quốc gia, việc mở dữ liệu còn giúp kiểm soát sự minh bạch trong hoạt động của chính phủ. Ví dụ như ở Vương quốc Anh, dự án “Where Does My Money Go?” được xây dựng nhằm thúc đẩy tính minh bạch và sự tham gia của người dân thông qua việc phân tích và hiển thị thông tin về chi tiêu công của Vương quốc Anh; từ đó, người dân có thế biết Chính phủ đã chi tiền thuế như thế nào.
Lợi ích của dữ liệu mở còn được thể hiện trên các phương diện kinh tế, văn hoá, xã hội. Ví dụ Bộ Giáo dục Hà Lan đã xuất bản trực tuyến tất cả các dữ liệu có liên quan tới giáo dục của họ để sử dụng lại. Kể từ đó, số lượng các câu hỏi họ nhận được đã giảm mạnh, làm giảm tải công việc và các chi phí có liên quan[1].
Theo báo cáo của Uỷ ban Châu Âu, từ năm 2016 đến năm 2020, quy mô thị trường trực tiếp của Dữ liệu mở tăng 36,9% từ 55,3 tỉ Euro vào năm 2016 lên 75,7 tỉ Euro vào năm 2020[2].
Bên cạnh đó, tổng giá trị thị trường của Dữ liệu Mở tại EU trong năm 2016 ước tính đạt từ 193 tỉ đến 209 tỉ Euro và đến năm 2020, con số này dự kiến rơi vào khoảng 265 tỉ đến 286 tỉ Euro.
Lượng dữ liệu sinh ra ngày càng lớn, đa dạng về chủng loại và có tốc độ tăng trưởng như vũ bão.
Ngoài ra, dữ liệu mở trong lĩnh vực văn hoá, giáo dục cũng góp phần bảo tồn, nâng cao giá trị văn hoá thông qua việc tạo ra các sản phẩm, dịch vụ mới, tạo ra các tri thức mới dựa trên nền tảng các dữ liệu văn học, nghệ thuật hiện có.
Có thể thấy, Việt Nam có nhiều cơ hội để khai thác tiềm năng và giá trị của dữ liệu mở với kho dữ liệu hiện tại. Tuy nhiên, điểm vướng mắc của Việt Nam là nhiều dữ liệu chưa chính thức được xác định là “dữ liệu mở” đúng nghĩa.
Hiểu đúng về “dữ liệu mở”
Theo cách tiếp cận của Open Knowlegde Foundation, “dữ liệu mở” là dữ liệu có thể được bất kỳ ai tự do sử dụng, sử dụng lại và phân phối - chỉ tuân theo, nhiều nhất, yêu cầu ghi nhận công và chia sẻ tương tự[3].
Với cách định nghĩa này, để một dữ liệu được coi là dữ liệu mở cần có 03 đặc điểm:
Thứ nhất, dữ liệu phải sẵn sàng một cách tổng thể, thuận tiện và có khả năng tuỳ biến. Đồng thời, dữ liệu phải được truy cập và tải về qua Internet.
Thứ hai, khi dữ liệu được coi là dữ liệu mở thì dữ liệu đó cần phải được cung cấp theo các điều khoản ghi nhận trong giấy phép sử dụng lại và phân phối lại.
Thứ ba, không được có sự phân biệt trong việc sử dụng, sử dụng lại và phân phối lại dữ liệu, theo đó, mọi người đều có thể tiếp cận sử dụng dữ liệu cho bất kỳ mục đích của mình.
Một trong những điểm khác biệt quan trọng giữa dữ liệu mở và dữ liệu công khai (dữ liệu có thể truy cập trực tuyến) nằm ở giấy phép mở dữ liệu. Chỉ các dữ liệu được cấp giấy phép mở (ví dụ giấy phép CC-0, CC-By, CC-By-Sa,…) mới được coi là dữ liệu mở đúng nghĩa. Còn các dữ liệu không được cấp bất kỳ giấy phép hoặc được cấp phép nhưng không cho phép sử dụng cho mục đích thương mại hay tạo tác phẩm phái sinh,… thì chỉ được xác định là tài nguyên công khai, có thể truy cập trực tuyến.
Những hoạt động nhằm thúc đẩy mối quan tâm về “dữ liệu mở”
Sự tác động của đại dịch COVID-19 với những giải pháp công nghệ hoàn toàn mới đã chứng minh rằng dữ liệu mở là cần thiết trong cuộc sống nói chung và nghiên cứu khoa học nói riêng. Với sự nổi lên của các cộng đồng phần cứng nguồn mở, cộng đồng những người chế tạo là công dân bình thường và/hoặc các doanh nghiệp nhỏ (dưới 5 nhân công), họ thiết kế và chế tạo các thiết bị bảo vệ cá nhân và vật tư y tế hiện đang rất thiếu do sự đứt gãy chuỗi cung ứng toàn cầu[4].
Lĩnh vực này là sự kết hợp giữa ngành y tế và sản xuất công nghiệp - 2 trong số 8 lĩnh vực được ưu tiên trong chiến lược chuyển đổi số của Việt Nam. Dựa trên ví dụ này, việc rà soát các phần mềm/phần cứng đã xây dựng có liên quan tới COVID-19 từ nguồn vốn cấp của nhà nước và các tập đoàn nhà nước để yêu cầu mở dữ liệu và đưa vào danh sách các cơ sở dữ liệu cần phải mở là ý tưởng nên được xem xét.
Trên thế giới, UNESCO hiện đang thúc đẩy quá trình mở dữ liệu trong lĩnh vực giáo dục với các loại tài liệu dạy, học và nghiên cứu ở bất kỳ định dạng và phương tiện nào nằm trong phạm vi công cộng hoặc có bản quyền đã được phát hành theo một giấy phép mở, cho phép những mọi người không mất chi phí để truy cập, sử dụng lại, tùy biến thích nghi và phân phối lại.
Khuyến cáo tài nguyên Giáo dục mở của UNESCO đã được 193 quốc gia phê chuẩn ngày 25/11/2019, trong đó có Việt Nam. Ngoài ra, một bản thảo Khuyến cáo Khoa học Mở cũng được UNESCO công bố vào ngày 12/05/2021 và dự kiến sẽ được 193 quốc gia thành viên UNESCO phê chuẩn vào tháng 11/2021.
Hội Truyền thông số Việt Nam (VDCA) và Khối liên minh dữ liệu mở Châu Á (AODP) dự kiến trong tháng 10/2021 sẽ đồng tổ chức Hội nghị Đối tác Dữ liệu Mở châu Á 2021 (Asia Open Data Partnership 2021). Đây là sự kiện thường niên do AODP và các đối tác tổ chức kể từ 2015. Tổng cộng đã có 22 tổ chức của khu vực tham gia.
Hội nghị được diễn ra ở Việt Nam lần này sẽ tập trung thảo luận về dữ liệu mở trong 4 lĩnh vực: giáo dục, y tế, tài chính, du lịch. Dữ liệu mở là nền tảng cho nhiều công nghệ phát triển trong kỷ nguyên số, phù hợp với định hướng, chính sách phát triển trong thời gian tới của Việt Nam. Bên cạnh đó, Hội nghị là dịp để các doanh nghiệp Việt Nam và quốc tế cùng kết nối, mở ra các cơ hội hợp tác kinh doanh.
[2] European Commission, Creating Value through Open Data, Study on the Impact of Re-use of Public Data Resources,https://www.europeandataportal.eu/sites/default/files/edp_creating_value_through_open_data_0.pdf.
[4] (1) Cavalcanti, Gui; Cocciole, Claire; Cole, Christina; Forgues, Angela; Jaqua, Victoria; Jones-Davis, Dorothy; Merlo, Sabrina (2021). “Design | Make | Protect: A report on the Open Source Maker and Manufacturer Response to the COVID-19 PPE Crisis.” Open Source Medical Supplies & Nation of Makers.
(2) Anne Bowser Alex Long Alexandra Novak Alison Parker Michael Weinberg, Stitching Together a Solution: Lessons from the Open Source Hardware Response to COVID-19, Wilson Center Science, https://www.law.nyu.edu/sites/default/files/stitching-together-a-solution-202102.pdf
Theo Viettimes