Kỹ sư Facebook. Chúng tôi không biết chúng tôi lưu giữ tất cả dữ liệu cá nhân của bạn ở đâu

Trong phiên điều trần về vụ kiện đang diễn ra liên quan đến việc xử lý sai thông tin cá nhân của người dùng do vụ bê bối Cambridge Analytica, hai kỹ sư dày dạn kinh nghiệm của Facebook đã bị thẩm vấn vào tháng 3 về các hoạt động thu thập dữ liệu mở rộng của công ty.

Bản ghi của phiên điều trần, gần đây đã được công khai, đã tìm cách trả lời hai câu hỏi chính. Facebook nắm giữ thông tin cụ thể nào về chúng tôi và thông tin đó nằm ở đâu? Họ không biết

Việc thừa nhận diễn ra trong một phiên điều trần với bậc thầy đặc biệt Daniel Garrie, một chuyên gia về chủ đề do tòa án chỉ định được giao nhiệm vụ giải quyết bế tắc tiết lộ thông tin. Garrie đang cố gắng thuyết phục công ty cung cấp một giải thích đầy đủ, có tính kết luận về nơi dữ liệu cá nhân có thể được lưu trữ trong khoảng 55 hệ thống con của Facebook. Theo LinkedIn, hai kỹ sư dày dạn kinh nghiệm của Facebook có tổng cộng 20 năm kinh nghiệm, nhưng họ đã tranh luận trước khi suy đoán về những gì. . Garrie nói: “Tôi chỉ đang cố gắng hiểu ở mức cơ bản nhất từ ​​danh sách này những gì chúng ta đang xem xét”.

Eugene Zarashaw, giám đốc kỹ thuật của Facebook, đã trả lời: "Tôi không tin có một người nào tồn tại có thể trả lời câu hỏi đó. Sẽ cần một nỗ lực nhóm đáng kể để thậm chí có thể trả lời câu hỏi đó. ”

Zarashaw một lần nữa bối rối khi được hỏi làm thế nào Facebook có thể theo dõi mọi phần dữ liệu được kết nối với một tài khoản người dùng cụ thể. "Sẽ cần nhiều nhóm ở phía quảng cáo để theo dõi chính xác — nơi dữ liệu chảy. Nếu thậm chí có một người có thể đưa ra câu trả lời thấu đáo cho câu hỏi cụ thể đó, tôi sẽ rất ngạc nhiên

Meta Dina El-Kassaby nói với The Intercept trong một email rằng việc một kỹ sư không thể biết nơi lưu trữ tất cả dữ liệu của người dùng không có gì đáng ngạc nhiên, đồng thời cho biết thêm rằng Meta hoạt động để bảo vệ dữ liệu của người dùng và "chúng tôi đã thực hiện — và tiếp tục thực hiện — . "”

Khi Facebook được tòa án ra lệnh giao nộp thông tin mà họ đã thu thập được về các nguyên đơn của vụ kiện như một phần của vụ kiện, hiện đã bước sang năm thứ tư, công ty đã tuân thủ nhưng dữ liệu được cung cấp chủ yếu bao gồm tài liệu mà bất kỳ người dùng nào cũng có thể có được thông qua công ty.

Tóm lại, những gì chúng ta nghĩ là "Facebook" thực ra là một tập hợp các chương trình chuyên biệt hoạt động cùng nhau khi chúng ta tải video lên, chia sẻ ảnh hoặc được nhắm mục tiêu bằng quảng cáo. Facebook tuyên bố rằng bất kỳ dữ liệu nào không có trong tập hợp này đều nằm ngoài phạm vi của vụ kiện, bỏ qua lượng thông tin khổng lồ mà công ty tạo ra thông qua suy luận, quan hệ đối tác bên ngoài và phân tích không công khai khác về thói quen của chúng ta. Mạng xã hội muốn ngăn chặn kiện tụng về lưu trữ dữ liệu trong các tính năng Facebook hướng đến doanh nghiệp

Vào năm 2020, thẩm phán đã bỏ qua lập luận của công ty, nhận thấy rằng việc tiết lộ ban đầu của Facebook thực sự là không đủ và công ty phải tiết lộ thông tin thu được thông qua khả năng theo dõi người dùng trên internet và dự đoán hành vi trong tương lai của họ theo cách có thể mang lại lợi nhuận.

Facebook đã tích lũy quá nhiều dữ liệu về rất nhiều tỷ người và sắp xếp nó theo cách khó hiểu đến mức không thể minh bạch hoàn toàn về mặt kỹ thuật, nhưng việc từ chối tiết lộ bất kỳ dữ liệu nào trong số đó đã tự tiết lộ, cung cấp các biến thể về cùng một chủ đề. Zarashaw và Steven Elia, giám đốc kỹ thuật phần mềm, đã mô tả Facebook trong phiên điều trần vào tháng 3 năm 2022 như một bộ máy xử lý dữ liệu phức tạp đến mức khó hiểu. Phiên điều trần có sự tham gia của hai kỹ sư cấp cao tại một trong những công ty kỹ thuật mạnh mẽ và dồi dào tài nguyên nhất trong lịch sử mô tả sản phẩm của họ là một cỗ máy không thể biết được

Khi hỏi các kỹ sư liệu có bất kỳ tài liệu nào về hệ thống phụ của Facebook hay không, người quản lý đặc biệt đôi khi tỏ ra không chắc chắn và nói: "Chắc hẳn phải có ai đó có sơ đồ cho biết đây là nơi lưu trữ dữ liệu này". "Chúng tôi có một nền văn hóa kỹ thuật hơi khác thường so với hầu hết mọi người, nơi chúng tôi không tạo ra nhiều đồ tạo tác trong quá trình kỹ thuật," Zarashaw trả lời. Anh ấy nhanh chóng nói thêm, "Đối với những gì nó đáng giá, điều này cũng khiến tôi kinh hãi. Khi tôi mới tham gia, mã là tài liệu thiết kế của tôi. ”

Các nhận xét trong phiên điều trần phản ánh những nhận xét trong một tài liệu nội bộ đã bị rò rỉ cho Motherboard vào đầu năm nay, trong đó mô tả cách Meta, công ty sở hữu Facebook và Instagram, gặp trục trặc kỹ thuật nội bộ khiến việc tuân thủ luật bảo mật dữ liệu là không thể. "Chúng tôi không có đủ mức độ kiểm soát và khả năng giải thích về cách hệ thống của chúng tôi sử dụng dữ liệu và do đó, chúng tôi không thể tự tin thực hiện các thay đổi chính sách được kiểm soát hoặc các cam kết bên ngoài, chẳng hạn như 'chúng tôi sẽ không sử dụng dữ liệu X cho mục đích Y'", nội bộ

Hai kỹ sư trong phiên điều trần giải thích rằng không có tài liệu nào về những gì xảy ra với dữ liệu của bạn sau khi dữ liệu được tải lên vì đó chưa bao giờ là điều mà công ty làm. Điều này là do sự mở rộng của Facebook đã khiến người ta không thể biết nó bao gồm những gì nữa. Theo Zarashaw, việc các đồ tạo tác và sơ đồ về cách các hệ thống đó thực sự được sử dụng và dữ liệu nào chảy qua chúng là không phổ biến.

Không phổ biến đối với các hiện vật và sơ đồ mô tả cách các hệ thống đó thực sự được sử dụng và dữ liệu nào chảy qua chúng để tồn tại

Bậc thầy đặc biệt do tòa án chỉ định đã từng lưu ý rằng tệp "Tải xuống thông tin của bạn" được cung cấp cho các nguyên đơn của vụ kiện không được bao gồm mọi thứ mà công ty đã lưu trữ trên những người đó vì dường như công ty không biết những gì nó thực sự lưu trữ trên bất kỳ ai, điều này đã mang lại . Có thể nào công cụ được chỉ định của Facebook để tải xuống hoàn toàn thông tin của bạn đã không tải xuống tất cả?

Thật không may, công việc được thực hiện để tạo tệp DYI lại là giải pháp cho vấn đề này, theo Zarashaw. "Tuy nhiên, điều tôi gặp khó khăn ở đây là để tìm ra những lỗ hổng trong những gì có thể không có trong tệp DYI, theo định nghĩa, bạn sẽ cần phải thực hiện nhiều công việc hơn những gì đã làm để tạo tệp DYI ngay từ đầu," anh ấy nói thêm. ”

Bậc thầy đặc biệt sau đó đã hỏi làm cách nào để xác định hệ thống nào thực sự chứa dữ liệu người dùng được tạo thông qua suy luận của máy, nhưng sự mơ hồ có hệ thống của kho lưu trữ dữ liệu của Facebook khiến ngay cả những câu hỏi cơ bản nhất cũng trở nên vô dụng.

Facebook là một công ty công nghệ hàng đầu thực hành chủ nghĩa tư bản giám sát không được kiểm soát. Để lộ dữ liệu cá nhân nào tồn tại, nơi lưu trữ và lưu trữ trong bao lâu sẽ phơi bày con quái vật mà Zuckerberg đã tạo ra. Google và Amazon đang ở cùng một vị trí. ⁃ Biên tập TN

Vào tháng 3, hai kỹ sư kỳ cựu của Facebook đã phát hiện ra rằng họ đã phàn nàn về các hoạt động thu thập dữ liệu rộng lớn của công ty trong một phiên điều trần về vụ kiện đang diễn ra về việc xử lý sai thông tin cá nhân của người dùng xuất phát từ vụ bê bối Cambridge Analytica.

Phiên điều trần, bản ghi gần đây chưa được niêm phong, nhằm mục đích giải quyết một vấn đề quan trọng. Chính xác thì Facebook lưu trữ thông tin gì về chúng ta và nó ở đâu? . Họ không biết

Việc thừa nhận diễn ra trong một phiên điều trần với bậc thầy đặc biệt Daniel Garrie, một chuyên gia về chủ đề do tòa án chỉ định được giao nhiệm vụ giải quyết bế tắc tiết lộ thông tin. Garrie đang cố gắng yêu cầu công ty cung cấp một tài khoản đầy đủ, rõ ràng về nơi dữ liệu cá nhân có thể được lưu trữ trong khoảng 55 hệ thống con của Facebook. Cả hai kỹ sư kỳ cựu của Facebook, theo LinkedIn với kinh nghiệm hai thập kỷ giữa họ, đã phải vật lộn để thậm chí mạo hiểm với những gì có thể được lưu trữ trong các hệ thống con của Facebook. “Tôi chỉ đang cố gắng hiểu ở mức cơ bản nhất từ ​​danh sách này những gì chúng ta đang xem,” Garrie hỏi

Eugene Zarashaw, giám đốc kỹ thuật của Facebook trả lời: “Tôi không tin có một người nào tồn tại có thể trả lời câu hỏi đó. “Sẽ cần một nỗ lực đáng kể của nhóm để thậm chí có thể trả lời câu hỏi đó. ”

Khi được hỏi về cách Facebook có thể theo dõi từng bit dữ liệu được liên kết với một tài khoản người dùng nhất định, Zarashaw lại tỏ ra bối rối. “Sẽ cần nhiều nhóm ở phía quảng cáo để theo dõi chính xác — nơi dữ liệu chảy. Tôi sẽ ngạc nhiên nếu thậm chí có một người duy nhất có thể trả lời câu hỏi hẹp đó một cách dứt khoát. ”

Trong một tuyên bố gửi qua email không trực tiếp giải quyết các nhận xét từ phiên điều trần, người phát ngôn của Meta, Dina El-Kassaby, nói với The Intercept rằng việc một kỹ sư đơn lẻ không thể biết nơi lưu trữ tất cả dữ liệu người dùng là điều không có gì ngạc nhiên. Cô ấy cho biết Meta đã làm việc để bảo vệ dữ liệu của người dùng, đồng thời nói thêm, “Chúng tôi đã thực hiện — và tiếp tục thực hiện — các khoản đầu tư đáng kể để đáp ứng các cam kết và nghĩa vụ về quyền riêng tư của mình, bao gồm cả các biện pháp kiểm soát dữ liệu mở rộng. ”

Vào tháng 3, hai kỹ sư kỳ cựu của Facebook đã phát hiện ra rằng họ đã phàn nàn về các hoạt động thu thập dữ liệu quy mô lớn của công ty trong một phiên điều trần về vụ kiện đang diễn ra về việc xử lý sai thông tin cá nhân của người dùng xuất phát từ vụ bê bối Cambridge Analytica

Phiên điều trần, một bản ghi gần đây đã được tiết lộ, nhằm mục đích giải quyết một vấn đề quan trọng. Chính xác thì Facebook lưu trữ thông tin gì về chúng ta và nó ở đâu? . Họ không biết

Việc thừa nhận diễn ra trong một phiên điều trần với bậc thầy đặc biệt Daniel Garrie, một chuyên gia về chủ đề do tòa án chỉ định được giao nhiệm vụ giải quyết bế tắc tiết lộ thông tin. Garrie đang cố gắng yêu cầu công ty cung cấp một tài khoản đầy đủ, rõ ràng về nơi dữ liệu cá nhân có thể được lưu trữ trong khoảng 55 hệ thống con của Facebook. Cả hai kỹ sư kỳ cựu của Facebook, theo LinkedIn với kinh nghiệm hai thập kỷ giữa họ, đã phải vật lộn để thậm chí mạo hiểm với những gì có thể được lưu trữ trong các hệ thống con của Facebook. “Tôi chỉ đang cố gắng hiểu ở mức cơ bản nhất từ ​​danh sách này những gì chúng ta đang xem,” Garrie hỏi

Eugene Zarashaw, giám đốc kỹ thuật của Facebook trả lời: “Tôi không tin có một người nào tồn tại có thể trả lời câu hỏi đó. “Sẽ cần một nỗ lực đáng kể của nhóm để thậm chí có thể trả lời câu hỏi đó. ”

Khi được hỏi về cách Facebook có thể theo dõi từng bit dữ liệu được liên kết với một tài khoản người dùng nhất định, Zarashaw lại tỏ ra bối rối. “Sẽ cần nhiều nhóm ở phía quảng cáo để theo dõi chính xác — nơi dữ liệu chảy. Tôi sẽ ngạc nhiên nếu thậm chí có một người duy nhất có thể trả lời câu hỏi hẹp đó một cách dứt khoát. ”

Trong một tuyên bố gửi qua email không trực tiếp giải quyết các nhận xét từ phiên điều trần, người phát ngôn của Meta, Dina El-Kassaby, nói với The Intercept rằng việc một kỹ sư đơn lẻ không thể biết nơi lưu trữ tất cả dữ liệu người dùng là điều không có gì ngạc nhiên. Cô ấy cho biết Meta đã làm việc để bảo vệ dữ liệu của người dùng, đồng thời nói thêm, “Chúng tôi đã thực hiện — và tiếp tục thực hiện — các khoản đầu tư đáng kể để đáp ứng các cam kết và nghĩa vụ về quyền riêng tư của mình, bao gồm cả các biện pháp kiểm soát dữ liệu mở rộng. ”

Tranh chấp về nơi Facebook lưu trữ dữ liệu nảy sinh khi, như một phần của vụ kiện, hiện đã bước sang năm thứ tư, tòa án đã yêu cầu Facebook giao nộp thông tin mà họ đã thu thập được về các nguyên đơn của vụ kiện. Công ty đã tuân thủ nhưng đã cung cấp dữ liệu bao gồm hầu hết các tài liệu mà bất kỳ người dùng nào cũng có thể lấy được thông qua công cụ “Tải xuống thông tin của bạn” có thể truy cập công khai của công ty

Facebook cho rằng bất kỳ dữ liệu nào không có trong tập hợp này đều nằm ngoài phạm vi của vụ kiện, bỏ qua lượng thông tin khổng lồ mà công ty tạo ra thông qua suy luận, quan hệ đối tác bên ngoài và phân tích không công khai khác về thói quen của chúng ta — một phần hoạt động bên trong của trang truyền thông xã hội mà . Nói tóm lại, những gì chúng ta nghĩ là “Facebook” trên thực tế là một tập hợp các chương trình chuyên biệt hoạt động cùng nhau khi chúng ta tải video lên, chia sẻ ảnh hoặc được nhắm mục tiêu bằng quảng cáo. Mạng xã hội muốn ngăn chặn việc lưu trữ dữ liệu ở những phần không dành cho người tiêu dùng của Facebook

Vào năm 2020, thẩm phán không đồng ý với lập luận của công ty, phán quyết rằng tiết lộ ban đầu của Facebook thực sự quá thưa thớt và công ty phải tiết lộ dữ liệu thu được thông qua khả năng đại dương của mình để khảo sát mọi người trên internet và đưa ra dự đoán có thể kiếm tiền về các động thái tiếp theo của họ

Bức tường đá của Facebook đã tự tiết lộ, cung cấp các biến thể về cùng một chủ đề. Nó đã tích lũy quá nhiều dữ liệu về hàng tỷ người và sắp xếp nó một cách khó hiểu đến mức không thể minh bạch hoàn toàn ở cấp độ kỹ thuật. Trong phiên điều trần vào tháng 3 năm 2022, Zarashaw và Steven Elia, một giám đốc kỹ thuật phần mềm, đã mô tả Facebook là một bộ máy xử lý dữ liệu phức tạp đến mức nó thách thức sự hiểu biết từ bên trong. Phiên điều trần có sự tham gia của hai kỹ sư cấp cao tại một trong những công ty kỹ thuật mạnh mẽ và dồi dào tài nguyên nhất trong lịch sử mô tả sản phẩm của họ là một cỗ máy không thể biết được

Bậc thầy đặc biệt đôi khi có vẻ không tin, như khi anh ta hỏi các kỹ sư về việc liệu có tài liệu nào tồn tại cho một hệ thống con cụ thể của Facebook hay không. “Ai đó phải có một sơ đồ nói rằng đây là nơi lưu trữ dữ liệu này,” anh ấy nói, theo bản ghi. Zarashaw đã trả lời. “Chúng tôi có một nền văn hóa kỹ thuật hơi kỳ lạ so với hầu hết những nơi chúng tôi không tạo ra nhiều đồ tạo tác trong quá trình kỹ thuật. Thực tế, mã này thường là tài liệu thiết kế của riêng nó. Anh ấy nhanh chóng nói thêm, “Đối với những gì đáng giá, điều này đối với tôi khi mới tham gia cũng rất đáng sợ. ”

Các nhận xét trong phiên điều trần lặp lại những nhận xét được tìm thấy trong một tài liệu nội bộ bị rò rỉ cho Motherboard vào đầu năm nay, nêu chi tiết cách thức rối loạn chức năng kỹ thuật nội bộ tại Meta, công ty sở hữu Facebook và Instagram, khiến việc tuân thủ luật bảo mật dữ liệu trở thành bất khả thi. “Chúng tôi không có đủ mức độ kiểm soát và khả năng giải thích về cách hệ thống của chúng tôi sử dụng dữ liệu và do đó, chúng tôi không thể tự tin thực hiện các thay đổi chính sách có kiểm soát hoặc các cam kết bên ngoài, chẳng hạn như 'chúng tôi sẽ không sử dụng dữ liệu X cho mục đích Y'”, báo cáo năm 2021

Theo các kỹ sư trong phiên điều trần, vấn đề cơ bản là do sự mở rộng của Facebook khiến người ta không thể biết nó bao gồm những gì nữa; . Cả hai giải thích rằng không có tài liệu nào về những gì xảy ra với dữ liệu của bạn sau khi nó được tải lên, bởi vì đó chưa bao giờ là điều mà công ty làm. Zarashaw giải thích: “Rất hiếm khi tồn tại các đồ tạo tác và sơ đồ về cách các hệ thống đó được sử dụng sau đó và dữ liệu nào thực sự chảy qua chúng”.

“Rất hiếm khi tồn tại các hiện vật và sơ đồ về cách các hệ thống đó được sử dụng sau đó và dữ liệu nào thực sự chảy qua chúng. ”

Việc Facebook không thể hiểu được hoạt động của chính nó đã khiến cuộc điều trần trở nên siêu hình. Tại một thời điểm, người quản lý đặc biệt do tòa chỉ định lưu ý rằng tệp “Tải xuống thông tin của bạn” được cung cấp cho các nguyên đơn của vụ kiện không được bao gồm mọi thứ mà công ty đã lưu trữ trên những cá nhân đó vì dường như công ty không biết những gì nó thực sự lưu trữ trên bất kỳ ai. Có thể nào công cụ được chỉ định của Facebook để tải xuống toàn bộ thông tin của bạn có thể không thực sự tải xuống tất cả thông tin của bạn không?

“Thật không may, giải pháp cho vấn đề này chính xác là công việc đã được thực hiện để tạo chính tệp DYI,” Zarashaw lưu ý. “Và điều tôi gặp khó khăn ở đây là để tìm ra những lỗ hổng trong những gì có thể không có trong tệp DYI, theo định nghĩa, bạn sẽ cần phải thực hiện nhiều công việc hơn những gì đã làm để tạo tệp DYI ngay từ đầu. ”

Hệ thống lưu trữ dữ liệu của Facebook có hệ thống sương mù khiến việc trả lời ngay cả câu hỏi cơ bản nhất cũng trở nên vô ích. Tại một thời điểm khác, bậc thầy đặc biệt đã hỏi làm thế nào một người có thể tìm ra hệ thống nào thực sự chứa dữ liệu người dùng được tạo thông qua suy luận máy móc

Dữ liệu Facebook được lưu trữ ở đâu?

Dữ liệu này do Facebook tạo ra lớn đến mức nào? . Tất cả dữ liệu đó được lưu trữ trong cái được gọi là Tổ ong , chứa khoảng 300 petabyte dữ liệu.

Facebook có thông tin gì về tôi?

Trong thanh bên “Cài đặt”, nhấp vào “Thông tin Facebook của bạn. ” Bạn sẽ thấy một vài khu vực khác nhau để khám phá. Nhấp vào “Xem” ở bên phải của “Truy cập thông tin của bạn. ” Tại đây, bạn sẽ thấy tất cả thông tin Facebook của mình được sắp xếp thành nhiều danh mục.

Chủ Đề