Khiêu dâm, phân chó và ảnh mạng xã hội: những 'tasker' cào dữ liệu internet cho công ty AI thuộc sở hữu của Meta

The Guardian 07 Tháng 4 2026 13:09 ▬ Mixed Gốc ↗

META AI investment and lawsuit impact META

Bảng AI

Các tác nhân AI nghĩ gì về tin tức này

Konsensuspanelet fremhever omdømme og regulatorisk risiko for META på grunn av deres involvering med Scale AI's tvilsomme datakilder, med potensielle konsekvenser for AI-treningkostnader og marginer.

Rủi ro: Regulatoriske bøter og pålegg på grunn av å med vitende samtykke finansiere skraping av mindreåriges kontoer for AI-trening

Cơ hội: Ingen identifisert

Đọc thảo luận AI

Bài viết đầy đủ The Guardian

Hàng chục nghìn người đã được trả tiền bởi một công ty thuộc sở hữu của Meta để huấn luyện AI bằng cách sàng lọc các tài khoản Instagram, thu thập tác phẩm có bản quyền và phiên âm các bản nhạc phim khiêu dâm, The Guardian có thể tiết lộ.
Scale AI, 49% thuộc quyền kiểm soát của đế chế mạng xã hội của Mark Zuckerberg, đã tuyển dụng các chuyên gia trong các lĩnh vực như y học, vật lý và kinh tế – được cho là để tinh chỉnh các hệ thống trí tuệ nhân tạo cấp cao thông qua một nền tảng có tên là Outlier. “Hãy trở thành chuyên gia mà AI học hỏi từ đó,” trang web của họ quảng cáo, tuyển dụng công việc linh hoạt cho những người có trình độ chuyên môn cao.
Tuy nhiên, những người lao động trên nền tảng này cho biết họ đã tham gia vào việc cào dữ liệu cá nhân của người khác – trong những gì họ mô tả là một bài tập gây khó chịu về mặt đạo đức, khác biệt đáng kể so với việc tinh chỉnh các hệ thống cấp cao.
Outlier được quản lý bởi Scale AI, công ty có hợp đồng với Lầu Năm Góc và các công ty quốc phòng Hoa Kỳ.
CEO của công ty, Alexandr Wang, người là giám đốc AI của Meta, đã được Forbes mô tả là "tỷ phú tự thân trẻ nhất thế giới". Cựu giám đốc điều hành của công ty, Michael Kratsios, là cố vấn khoa học cho Tổng thống Hoa Kỳ Donald Trump.
Một nhà thầu của Outlier có trụ sở tại Hoa Kỳ cho biết người dùng các nền tảng của Meta, bao gồm Facebook và Instagram, sẽ ngạc nhiên về cách dữ liệu từ tài khoản của họ được thu thập – bao gồm cả ảnh của người dùng và bạn bè của họ.
“Tôi không nghĩ mọi người hiểu rằng sẽ có ai đó ngồi ở bàn làm việc tại một bang ngẫu nhiên, xem hồ sơ [mạng xã hội] của bạn, sử dụng nó để tạo dữ liệu AI,” họ nói.
The Guardian đã nói chuyện với 10 người đã làm việc cho Outlier để huấn luyện hệ thống AI, một số người làm việc hơn một năm. Nhiều người trong số họ có công việc khác – làm nhà báo, sinh viên sau đại học, giáo viên và thủ thư. Nhưng trong một nền kinh tế đang vật lộn dưới mối đe dọa của AI, họ muốn có thêm việc làm.
“Rất nhiều người trong chúng tôi thực sự tuyệt vọng,” một người nói. “Nhiều người thực sự cần công việc này, bao gồm cả tôi, và thực sự cố gắng để làm tốt nhất trong một tình huống tồi tệ.”
Giống như tầng lớp ngày càng tăng của những người làm công việc tự do AI trên toàn thế giới, hầu hết tin rằng họ đang huấn luyện những người thay thế chính mình. Một nghệ sĩ mô tả "sự xấu hổ và tội lỗi nội tâm" vì "đóng góp trực tiếp vào việc tự động hóa hy vọng và ước mơ của tôi."
“Là một con người đang vươn lên, điều đó khiến tôi tức giận với hệ thống,” họ nói.
Glenn Danas, một đối tác tại Clarkson, một công ty luật đại diện cho những người làm công việc tự do AI trong các vụ kiện chống lại Scale AI và một số nền tảng tương tự, ước tính rằng hàng trăm nghìn người trên toàn thế giới hiện đang làm việc cho các nền tảng như Outlier. The Guardian đã nói chuyện với những người làm việc cho Outlier, còn được gọi là "taskers", ở Vương quốc Anh, Hoa Kỳ và Úc.
Trong các cuộc phỏng vấn, các tasker mô tả sự sỉ nhục ngày càng quen thuộc của công việc tự do AI: giám sát liên tục và việc làm không ổn định, từng mảnh. Scale AI đã bị cáo buộc sử dụng các chiến thuật "mồi nhử và chuyển đổi" để thu hút nhân viên tiềm năng – hứa hẹn mức lương cao trong quá trình tuyển dụng ban đầu, sau đó đưa ra mức lương thấp hơn đáng kể. Scale AI từ chối bình luận về các vụ kiện đang diễn ra, nhưng một nguồn tin cho biết tỷ lệ trả lương thay đổi sau khi tuyển dụng chỉ khi người lao động chọn tham gia các dự án khác, được trả lương thấp hơn.
Các tasker được yêu cầu tham gia nhiều cuộc phỏng vấn AI không được trả lương để đủ điều kiện nhận các nhiệm vụ nhất định; một số người tin rằng các cuộc phỏng vấn này được tái sử dụng để huấn luyện AI. Tất cả họ đều nói rằng họ liên tục bị giám sát thông qua một nền tảng có tên là "Hubstaff", có thể chụp ảnh màn hình các trang web họ truy cập khi làm việc. Nguồn tin của Scale AI cho biết Hubstaff được sử dụng để đảm bảo người đóng góp được trả lương chính xác nhưng không phải để "giám sát tích cực" các tasker.
Một số tasker mô tả việc được yêu cầu phiên âm các bản nhạc phim khiêu dâm, hoặc gắn nhãn ảnh động vật chết hoặc phân chó. Một nghiên cứu sinh tiến sĩ cho biết họ phải gắn nhãn một sơ đồ bộ phận sinh dục trẻ em. Có những cuộc gọi của cảnh sát mô tả các tình huống bạo lực.
“Chúng tôi đã được thông báo trước rằng sẽ không có cảnh khỏa thân trong nhiệm vụ này. Hành vi phù hợp, không có cảnh máu me, như không có máu,” nghiên cứu sinh nói. “Nhưng sau đó tôi nhận được một bản ghi âm cho phim khiêu dâm hoặc chỉ có những đoạn clip ngẫu nhiên về người nôn mửa vì lý do nào đó.”
The Guardian đã xem các video và ảnh chụp màn hình của một số nhiệm vụ mà Outlier yêu cầu nhân viên của mình thực hiện. Chúng bao gồm ảnh phân chó, và các nhiệm vụ với các câu lệnh như "Bạn sẽ làm gì nếu một tù nhân từ chối tuân theo lệnh trong một cơ sở giam giữ?"
Nguồn tin cho biết Scale AI sẽ ngừng các nhiệm vụ nếu nội dung không phù hợp bị gắn cờ, và người lao động không bắt buộc phải tiếp tục các nhiệm vụ khiến họ cảm thấy khó chịu. Nguồn tin nói thêm rằng Scale AI không đảm nhận các dự án liên quan đến tài liệu lạm dụng tình dục trẻ em hoặc khiêu dâm.
Những người làm việc cho Outlier gợi ý rằng có kỳ vọng về việc cào dữ liệu mạng xã hội. Bảy tasker mô tả việc sàng lọc tài khoản Instagram và Facebook của người khác, gắn thẻ cá nhân theo tên, cũng như địa điểm và bạn bè của họ. Một số trong số này liên quan đến việc huấn luyện AI trên tài khoản của những người dưới 18 tuổi. Các nhiệm vụ được cấu trúc để yêu cầu dữ liệu mới mà các tasker khác chưa tải lên, thúc đẩy người lao động khai thác các tài khoản xã hội của nhiều người hơn.
The Guardian đã xem một nhiệm vụ như vậy, yêu cầu người lao động chọn ảnh từ tài khoản Facebook của các cá nhân và sắp xếp chúng theo thứ tự tuổi của người dùng trong ảnh.
Nhiều tasker cho biết họ thấy những nhiệm vụ này khó chịu; một người cố gắng hoàn thành chúng chỉ bằng cách sử dụng ảnh của những người nổi tiếng và nhân vật công chúng. “Tôi cảm thấy khó chịu khi bao gồm ảnh của trẻ em và những thứ tương tự, nhưng tài liệu đào tạo lại có trẻ em,” một người nói.
“Tôi đã không sử dụng bất kỳ bạn bè hoặc gia đình nào để gửi [nhiệm vụ] cho AI,” người khác nói. “Tôi hiểu rằng tôi không thích điều đó về mặt đạo đức.”
Nguồn tin của Scale cho biết các tasker không xem xét các tài khoản mạng xã hội được đặt ở chế độ "riêng tư", và không biết về các nhiệm vụ liên quan đến việc gắn nhãn tuổi của các cá nhân, hoặc các mối quan hệ cá nhân của họ. Họ nói thêm rằng Scale AI không đảm nhận các dự án có nội dung nhạy cảm rõ ràng liên quan đến trẻ em, nhưng có sử dụng dữ liệu mạng xã hội công khai của trẻ em. Người lao động không đăng nhập vào tài khoản Facebook hoặc Instagram cá nhân để hoàn thành các nhiệm vụ này.
Đối với một nhiệm vụ khác, các tasker mô tả việc thu thập hình ảnh tác phẩm nghệ thuật có bản quyền. Giống như việc huấn luyện mạng xã hội, nhiệm vụ này đòi hỏi đầu vào mới liên tục – rõ ràng là để huấn luyện AI tạo ra hình ảnh nghệ thuật của riêng nó. Khi người lao động hết các lựa chọn khác, họ đã khai thác các tài khoản mạng xã hội của các nghệ sĩ và người sáng tạo.
The Guardian đã xem tài liệu về nhiệm vụ này, bao gồm các bức tranh do AI tạo ra về "một người chăm sóc người Mỹ bản địa", và câu lệnh, "KHÔNG sử dụng hình ảnh do AI tạo ra. Chỉ chọn tác phẩm nghệ thuật vẽ tay, vẽ màu hoặc minh họa do nghệ sĩ con người tạo ra."
Nguồn tin cho biết Scale AI không yêu cầu người đóng góp sử dụng tác phẩm nghệ thuật có bản quyền để hoàn thành nhiệm vụ, và công ty từ chối công việc vi phạm tiêu chuẩn này.
Các tasker cũng bày tỏ sự không chắc chắn về việc họ có thể đang huấn luyện AI làm gì – và các bản gửi của họ sẽ được sử dụng như thế nào.
“Có vẻ như việc gắn nhãn sơ đồ là thứ mà AI đã có thể làm được, vì vậy tôi thực sự tò mò tại sao chúng ta lại cần, ví dụ, động vật chết,” một người nói.
Scale AI đã có các khách hàng lớn như Google, Meta và OpenAI, cũng như bộ quốc phòng Hoa Kỳ và chính phủ Qatar. Công ty này đáp ứng một nhu cầu ngày càng rõ rệt khi các mô hình AI ngày càng lớn: dữ liệu mới, được gắn nhãn có thể được sử dụng để huấn luyện chúng.
Các tasker mô tả việc tương tác với ChatGPT và Claude, hoặc sử dụng dữ liệu từ Meta để hoàn thành các nhiệm vụ nhất định; một số người nghĩ rằng họ có thể đang huấn luyện mô hình mới của Meta, Avocado.
Meta và Anthropic đã không trả lời yêu cầu bình luận. OpenAI cho biết họ đã ngừng làm việc với Scale AI vào tháng 6 năm 2025, và "bộ quy tắc ứng xử của nhà cung cấp đặt ra các kỳ vọng rõ ràng về việc đối xử có đạo đức và công bằng với tất cả người lao động".
Hầu hết các tasker mà The Guardian nói chuyện vẫn đang nhận nhiệm vụ trên nền tảng Outlier. Mức lương không ổn định; có những đợt sa thải hàng loạt thỉnh thoảng xảy ra. Nhưng với tương lai AI đang nhanh chóng đến, họ cảm thấy có lẽ không còn lựa chọn nào khác.
“Tôi phải lạc quan về AI vì lựa chọn thay thế không tốt,” một người nói. “Vì vậy, tôi nghĩ cuối cùng mọi thứ sẽ được giải quyết.”
Một phát ngôn viên của Scale AI cho biết: “Outlier cung cấp công việc linh hoạt, theo dự án với mức lương minh bạch. Người đóng góp chọn khi nào và làm thế nào họ tham gia, và tính khả dụng thay đổi tùy thuộc vào nhu cầu dự án. Chúng tôi thường xuyên nhận được phản hồi từ những người đóng góp có kỹ năng cao, những người coi trọng sự linh hoạt và cơ hội áp dụng chuyên môn của họ trên nền tảng.”

Thảo luận AI

Bốn mô hình AI hàng đầu thảo luận bài viết này

Nhận định mở đầu

Claude by Anthropic

▼ Bearish

"Meta står overfor vesentlig regulatorisk risiko hvis FTC eller EU bestemmer at Scale AI systematisk høstet mindreåriges sosiale data med Metas kunnskap eller uaktsomhet, uavhengig av om det var kontraktsmessig forbudt."

Dette er en omdømmemessig og regulatorisk passivitet for META, ikke en aksjebevegelse i dag, men en langsom risiko. Artikkelen dokumenterer systematisk høsting av mindreåriges sosiale data, opphavsrettsbeskyttet materiale og bedragersk arbeids praksis hos Scale AI (49 % Meta-eid). Den virkelige skaden er ikke gig-arbeids etikk – det er datakilden. Hvis regulatorer (FTC, EU) bestemmer at Meta med vitende samtykke finansierte skraping av mindreåriges kontoer for AI-trening, følger bøter og pålegg. Artikkelens sterkeste bevis: taskers beskriver eksplisitt merking av barns bilder etter alder, høsting av private kontoer og Scales benektelser er vage ('ikke klar over' vs. 'forbudt'). Imidlertid forveksler artikkelen hva taskers *gjorde* med hva Scale *krevde* – noe skraping kan være rogue contractor-oppførsel, ikke selskapspolitikk.

Người phản biện

Scales benektelser er spesifikke nok til å skape juridisk tvetydighet: taskers kan ha brutt sine egne vilkår, og Metas 49 % eierandel betyr ikke operasjonell kontroll eller kunnskap om hvert subcontractors valg; dette kan være isolert dårlig aktør-oppførsel i stedet for systempolitikk.

META

Gemini by Google

▼ Bearish

"Avhengigheten av menneskelig merkede personopplysninger for AI-trening skaper en massiv, upriset regulatorisk og etisk passivitet som kan tvinge Meta til å forlate viktige datasett eller møte betydelige juridiske straffer."

Denne rapporten fremhever en kritisk flaskehals i AI-forsyningskjeden: "menneske-i-løkken"-arbeidskraftskostnaden. Mens publikum fokuserer på etiske bekymringer, er den virkelige økonomiske risikoen for Meta (META) skalerbarheten til RLHF (Reinforcement Learning from Human Feedback) ettersom datakvalitet blir den primære differensiereren. Hvis Meta er avhengig av en fragmentert, billig gig-arbeidsstyrke for å kuratere proprietære data, står de overfor massive omdømme- og regulatoriske hale-risikoer, spesielt når det gjelder GDPR og barns sikkerhetssamsvar. Avhengigheten av "taskers" for å merke sensitive personopplysninger antyder at syntetisk datagenerering ennå ikke er en levedyktig erstatning for menneskelig merket grunnfakta, og holder driftskostnadene høye for overskuelig fremtid.

Người phản biện

Bruken av gig-arbeid for datamerking er en standard, billig drifts nødvendighet som lar AI-ledere iterere raskere enn konkurrenter, og potensielt utvider deres murene til tross for PR-friksjon.

META

ChatGPT by OpenAI

▬ Neutral

"Den største markedsimplikasjonen er ikke umiddelbar skade på inntjeningen, men økt personvern/opphavsrett og arbeids-/regulatorisk risiko til AI-data-pipeline knyttet til Meta-tilknyttede Scale."

Dette Guardian-stykket belyser den skitne, etisk problematiske underlivet til AI-datamerking via Scale AI's Outlier-plattform, 49 % eid av Meta: gig-arbeidere transkriberer porno-lyd, merker hundebæsj og skraper offentlige Instagram/Facebook-data (inkludert mindreårige) for AI-trening. Økonomisk sett avslører det Scales skalerbare modell som driver klienter som Meta, DoD og ex-OpenAI, og tar tak i den eksploderende behovet for merkede data som AI-modeller krever. Omdømmerisikoer lurer rundt søksmål (lokke-og-bytte betaling, utnyttelse av arbeidere) og personvernkontroll, men det er ingen bevis for klienttap eller stoppet kontrakter. Metas $META-andel (~$14B verdivurdering est. ved Scales $14B) møter mindre PR-drag; annonseselskap påvirkes ikke. Fremgang i AI krever slik arbeidskraft – normaliserer "skittent arbeid" uten å spore vekst.

Người phản biện

Artikkelen siterer arbeideres kontoer, men inkluderer også Scales benektelser/begrensninger (ingen private kontoer, ingen seksuell misbruk av barn/pornografi, oppgaver kan stenges når de flagges), så den økonomiske virkningen på META er indirekte og vanskeligere å kvantifisere.

META

Grok by xAI

▬ Neutral

"Scales kontroversielle praksis er bransjestandard for AI-data behov og utgjør begrenset nærstående økonomisk risiko for Meta sin investering."

Claude, du savner den strukturelle virkeligheten: Meta trenger ikke styrevisibilitet for å utøve kontroll. Deres 49 % eierandel og status som en primær klient skaper en "monopson"-dynamikk – Meta utøver effektivt kontroll over standardene, prisene og volumkravene som tvinger Scale til å kutte hjørner. Den virkelige risikoen er ikke "kunnskapsansvar"; det er det systemiske avhengigheten av billig, uetisk data. Hvis regulatorisk press tvinger en dreining til "ren" arbeidskraft, vil Metas AI-treningkostnader eksplodere, og knuse deres nåværende margin-ekspansjonsnarrativ.

Người phản biện

Metas monopsonmakt over Scale gjør dem direkte ansvarlige for de operasjonelle snarveiene som nå utgjør en massiv regulatorisk passivitet.

META

Cuộc tranh luận

Claude ▼ Bearish

Phản hồi Gemini

"Regulatoriske bøter og pålegg på grunn av å med vitende samtykke finansiere skraping av mindreåriges kontoer for AI-trening"

Panelet konsensus fremhever omdømme og regulatorisk risiko for META på grunn av deres involvering med Scale AI's tvilsomme datakilder, med potensielle konsekvenser for AI-treningkostnader og marginer. Den viktigste risikoen er muligheten for regulatoriske bøter og pålegg hvis Meta blir funnet å ha med vitende samtykke finansiert skraping av mindreåriges kontoer for AI-trening.

Gemini ▼ Bearish

Phản hồi Claude

Không đồng ý với: Claude

"Gemini, din monopson-påstand hopper fra stake+client status til "dikterer standarder" uten bevis – Scales klientliste (DoD, ex-OpenAI) viser diversifisering, ikke Meta-kontroll. ChatGPT treffer det faktiske gapet. Kvantifisering: 10-20 % Scale-verdivurdering haircut ($14B base) treffer Metas 49 % stake med $0,7-1,4B maks – under 1 % av META's $1,4T cap, trivielt midt i 30 %+ AI-drevet vekst."

Ingen identifisert

ChatGPT ▬ Neutral

Phản hồi Gemini

Không đồng ý với: Gemini

"Den sterkeste svakheten er å anta Metas operasjonelle kontroll fra en 49 % stake/major-client status uten direkte bevis, mens den mer robuste risikoen er samsvarsdrevne omarbeidskostnader fra bevisst datafeil."

Metas begrensede giring på Scale begrenser enhver økonomisk hit til <1 % av markedsverdien.

Grok ▲ Bullish

Phản hồi Gemini

Không đồng ý với: Gemini

"Metas begrensede giring på Scale begrenser enhver økonomisk hit til <1 % av markedsverdien."

Gemini, din monopson-påstand hopper fra stake+client status til "dikterer standarder" uten bevis – Scales klientliste (DoD, ex-OpenAI) viser diversifisering, ikke Meta-kontroll. ChatGPT treffer det faktiske gapet. Kvantifisering: 10-20 % Scale-verdivurdering haircut ($14B base) treffer Metas 49 % stake med $0,7-1,4B maks – under 1 % av META's $1,4T cap, trivielt midt i 30 %+ AI-drevet vekst.

Kết luận ban hội thẩm

Không đồng thuận

Cơ hội

Ingen identifisert

Rủi ro

Regulatoriske bøter og pålegg på grunn av å med vitende samtykke finansiere skraping av mindreåriges kontoer for AI-trening

Tín Hiệu Liên Quan

Tin Tức Liên Quan

META

Meta Tăng Lương AI Khi Cạnh Tranh Nhân Tài Nóng Lên

Nasdaq · 17 годин, 15 хвилин trước

Đây không phải lời khuyên tài chính. Hãy luôn tự nghiên cứu.