FACEBOOK CÔNG BỐ DỮ LIỆU NGHIÊN CỨU XÃ HỘI HỌC LỚN NHẤT TỪNG ĐƯỢC XÂY DỰNG

  • FACEBOOK CÔNG BỐ DỮ LIỆU NGHIÊN CỨU XÃ HỘI HỌC LỚN NHẤT TỪNG ĐƯỢC XÂY DỰNG

  • Nguyệt Ánh

    Member
    17/02/2020 at 15:29

    Đây chắc chắn sẽ là một trong những sự kiện công nghệ & khoa học xã hội nhân văn lớn nhất trong năm nay !

    Ông trùm xâm phạm quyền riêng tư và khai thác dữ liệu người dùng Facebook vừa hợp tác với tổ chức Social Science One công bố kho dữ liệu mở gồm 38 triệu URLs (đường link web) được chia sẻ ít nhất 100 lần trên nền tảng Facebook từ 1/1/2017 đến 31/7/2019. Cùng với dữ liệu này là trên 1 vạn tỉ dữ liệu liên quan tới các URLs trên, như có những ai tương tác với các URLs này, nó có được người dùng gắn nhãn là fake news hay sử dụng từ ngữ xúc phạm hay không…

    Theo giới thiệu trên trang chủ dự án, thì cơ sở dữ liệu này được kì vọng “cho phép các nhà nghiên cứu xã hội học nghiên cứu những câu hỏi quan trọng nhất của thời đại về tác động của truyền thông đại chúng lên nền dân chủ và bỏ phiếu với những dữ liệu mà chưa từng có trước đây”. Để có được dữ liệu này, Facebook phải đã xử lý khoảng 1 exabyte dữ liệu (tương đương 1 tỷ Gigabyte dữ liệu), một con số lớn khủng khiếp mà ngay cả dữ liệu đã xử lý rồi cũng sẽ phải rất khéo léo mới truy vấn được trên một “server hiện đại với 64GB Ram”.

    Theo cá nhân mình nhận định, cơ sở dữ liệu này là một kho vàng đúng nghĩa ! Chỉ cần tách riêng được số URLs được chia sẻ bởi người Việt, đã có thể ươm mầm được biết bao đề tài nghiên cứu về báo chí, xã hội học, ngôn ngữ học, tâm lý học, marketing…với độ chính xác mà không phương pháp nghiên cứu truyền thống nào có thể đạt được.

    Nhưng “kho vàng” này cực lớn, và sẽ cần sự chung tay của rất nhiều chuyên gia dữ liệu, lập trình viên, nhà nghiên cứu…mới có thể “xơi” được.
    Vì vậy, mình muốn lập một public group để khai thác nguồn tài nguyên này. Có ai muốn join không ?

    siu tầm

Reply to: Nguyệt Ánh
Your information:

Cancel
Original Post
0 of 0 posts June 2018
Now