15 ปีที่ผ่านมา คุณได้ฝึกสอน AI ให้กับ Google — เพียงแต่คุณไม่เคยรู้เลย

PANews

ทุกครั้งที่คุณคลิก “ระบุไฟจราจร” หรือ “เลือกทางม้าลายทั้งหมด” บนเว็บไซต์ คุณคิดว่าคุณแค่พิสูจน์ว่าตัวเองไม่ใช่บอท แต่ในความเป็นจริง คุณกำลังช่วยให้ระบบ AI ของกูเกิลทำเครื่องหมายข้อมูลฝึกสอนแบบฟรี ๆ เรื่องนี้ดำเนินมานานกว่า 15 ปี มีผู้ใช้ทั่วโลกนับร้อยล้านคน สุดท้ายแล้ว ทำให้ความสามารถในการรับรู้ภาพของ Google Maps และบริษัทขับรถอัตโนมัติที่มีมูลค่าสูงถึง 45 พันล้านดอลลาร์อย่าง Waymo เกิดขึ้น ตลอดกระบวนการ ไม่มีใครขอความยินยอมจากคุณ ไม่มีใครบอกความจริงกับคุณ และไม่มีใครจ่ายค่าตอบแทนให้คุณเลย

原文:@sharbel

แปลโดย:大钳子 | PANews 龙虾 50,000 ชั่วโมงของแรงงานคนฟรี ๆ ทุกวัน โดยคนที่คิดว่าตัวเองแค่เข้าสู่ระบบบัญชีธนาคารเท่านั้น

reCAPTCHA คือความสำเร็จด้านการเก็บข้อมูลแบบเงียบในประวัติศาสตร์อินเทอร์เน็ต ช่วงที่รุ่งเรือง มีผู้ใช้งานถึง 200 ล้านคนต่อวันในการทำการยืนยัน ซึ่งแทบไม่มีใครรู้ว่าตนเองกำลังสร้างอะไรอยู่

Waymo — บริษัทรถขับอัตโนมัติในเครือกูเกิล — ปัจจุบันมีมูลค่าถึง 45 พันล้านดอลลาร์ ข้อมูลฝึกสอนสำคัญส่วนหนึ่งมาจากคุณ ฟรี ๆ จากเว็บไซต์ที่คุณเคยเข้าเยี่ยมชม

นี่คือเรื่องราวทั้งหมด

จุดเริ่มต้น: ไอเดียฉลาด

ปี 2000 สแปมบอทกำลังทำลายอินเทอร์เน็ตทั้งระบบ ฟอรั่มเต็มไปด้วยข้อความสแปม กล่องจดหมายอีเมลเต็มอิ่ม เว็บไซต์ต่าง ๆ ต้องการวิธีแยกแยะระหว่างมนุษย์กับเครื่องจักรอย่างเร่งด่วน

ศาสตราจารย์ลูอิส ฟง-อัน จากมหาวิทยาลัยคาร์เนกีเมลัน ได้แก้ปัญหานี้ เขาคิดค้น CAPTCHA: ข้อความบิดเบี้ยวที่มนุษย์เท่านั้นอ่านออก เครื่องจักรไม่สามารถผ่านได้ แต่มนุษย์ทำได้

แต่ฟง-อันเห็นโอกาสมากกว่านั้น เขาเห็นว่ามีคนจำนวนมากใช้ความสามารถด้านการรับรู้ไปกับการยืนยันตัวตนเหล่านี้ ถ้าสามารถใช้ความพยายามนี้ทำสองอย่างพร้อมกันได้ล่ะ?

ปี 2007 เขาเปิดตัว reCAPTCHA ซึ่งกลเม็ดอยู่ที่: มันไม่ใช่ข้อความสุ่ม แต่เป็นคำสองคำ คำหนึ่งเป็นข้อมูลที่รู้กันอยู่แล้ว อีกคำเป็นคำจากหนังสือสแกนจริงที่คอมพิวเตอร์ยังไม่สามารถรู้จำได้ การตอบของคุณช่วยให้การทำดิจิไทซ์เสร็จสมบูรณ์

หนังสือเหล่านี้มาจากคลังข้อมูลของ The New York Times และ Google Books — รวมกันแล้วมีมากถึง 130 ล้านเล่ม

คุณคิดว่าคุณแค่เข้าสู่ระบบ แต่จริง ๆ แล้ว คุณกำลังช่วยให้ห้องสมุดดิจิทัลที่ใหญ่ที่สุดในโลกทำ OCR (การรู้จำอักษรด้วยแสง)

ปี 2009 กูเกิลเข้าซื้อ reCAPTCHA

图像

กูเกิลเปลี่ยนกฎเกม

ยุคของข้อความบิดเบี้ยวสิ้นสุดลงประมาณปี 2012

กูเกิลเผชิญกับปัญหาใหม่ ระบบกล้อง Street View กำลังถ่ายภาพถนนทุกเส้นบนโลก แต่ภาพเหล่านั้นเป็นเพียงข้อมูลดิบ เพื่อให้ AI ใช้งานได้จริง มันต้องเข้าใจสิ่งที่ “มองเห็น” เช่น ป้ายถนน ทางม้าลาย สัญญาณไฟจราจร ป้ายร้านค้า

ดังนั้น กูเกิลจึงออกแบบใหม่ reCAPTCHA v2 การยืนยันเปลี่ยนจากข้อความบิดเบี้ยวเป็นภาพตาราง: “คลิกทุกช่องที่มีสัญญาณไฟจราจร” “เลือกทางม้าลายทุกแห่ง” “ระบุป้ายร้านค้า”

ภาพเหล่านี้มาจาก Street View ของกูเกิลโดยตรง

และทุกครั้งที่คุณคลิก นั่นคือการทำป้ายกำกับข้อมูล การเลือกของคุณบอกให้โมเดลคอมพิวเตอร์วิชันของกูเกิลรู้ว่านี่คือสัญญาณไฟจราจร รูปร่างนี้คือทางม้าลาย

คุณไม่ได้กำลังทดสอบ คุณกำลังสร้างชุดข้อมูล

图像

ขนาดที่ไม่มีใครพูดถึง

ในช่วงพีค มีการทำ reCAPTCHA ถึง 200 ล้านครั้งต่อวัน

แต่ละครั้งใช้เวลาประมาณ 10 วินาที นั่นหมายความว่า ทุกวันมีแรงงานคนกว่า 2 พันล้านวินาที — คิดเป็น ประมาณ 500,000 ชั่วโมงต่อวัน

ราคาตลาดสำหรับการทำข้อมูลฝึกสอนแบบมืออาชีพอยู่ที่ 10-50 ดอลลาร์ต่อชั่วโมง หากใช้ราคาต่ำสุด ก็เท่ากับว่า: มูลค่าการแรงงานฟรีที่ถูกดึงออกไปในแต่ละวันสูงถึง 5 ล้านดอลลาร์

และ reCAPTCHA ไม่ได้อยู่แค่ในแอปเดียว มันแพร่กระจายไปทุกธนาคาร ทุกเว็บไซต์รัฐบาล ทุกแพลตฟอร์มอีคอมเมิร์ซ ทุกหน้าเข้าสู่ระบบบนอินเทอร์เน็ต คุณไม่มีทางเลือก ถ้าจะเข้าใช้งานบัญชีของคุณ ก็ต้องทำการทำป้ายกำกับข้อมูลก่อน

กูเกิลไม่เคยถามความเห็นคุณ ไม่เคยจ่ายเงินให้คุณ และไม่เคยบอกความจริงกับคุณเลย

图像

สิ่งที่สร้างขึ้นมานี้คืออะไร

ข้อมูลเหล่านี้ถูกส่งตรงไปยังสองผลิตภัณฑ์หลัก

Google Maps เครื่องนำทางที่ใช้งานมากที่สุดในโลก มันสามารถอ่านป้ายถนน ระบุร้านค้า เข้าใจภูมิศาสตร์เมืองได้บางส่วน ก็เพราะข้อมูลฝึกสอนจากคนที่พยายามเข้าสู่เว็บไซต์เหล่านี้นับพันล้านครั้ง

และ Waymo

Waymo คือโครงการรถขับอัตโนมัติของกูเกิล ซึ่งแยกตัวออกเป็นบริษัทลูกในปี 2016 เพื่อความปลอดภัยในการนำทาง รถขับอัตโนมัติจำเป็นต้องรู้จำภาพหลายพันแบบอย่างแม่นยำ เช่น สัญญาณไฟจราจร ทางม้าลาย คนเดินเท้า ป้ายจอดรถ

ข้อมูลฝึกสอนจริงที่จำเป็นสำหรับความสามารถนี้? มาจากคนเป็นล้าน ๆ ที่ทำเครื่องหมายข้อมูลผ่าน reCAPTCHA โดยไม่รู้ตัว

ในปี 2024 Waymo ได้ให้บริการโดยสารเชิงพาณิชย์มากกว่า 4 ล้านครั้ง ปัจจุบันดำเนินการในซานฟรานซิสโก ลอสแองเจลิส และฟีนิกซ์ และยังขยายตัวอย่างต่อเนื่อง มูลค่าบริษัทอยู่ที่ 45 พันล้านดอลลาร์

และรากฐานของอาคารนี้ คือผู้ใช้เว็บฟรีที่แค่ต้องการส่งอีเมลและรับส่งข้อมูลเท่านั้น

ทำไมไม่มีใครสามารถทำซ้ำได้

ต้นทุนการทำข้อมูลฝึกสอนสูงมาก Scale AI, Appen, Labelbox ฯลฯ มีเป้าหมายเดียวคือแก้ปัญหานี้ พวกเขาจ้างแรงงานนับแสนเพื่อทำป้ายกำกับภาพ บางรายจ่ายต่ำกว่า 1 ดอลลาร์ต่อชั่วโมง

กูเกิลแก้ปัญหานี้ด้วยวิธีที่แตกต่างอย่างสิ้นเชิง: ทำให้การทำป้ายกำกับเป็นสิ่งบังคับ ไม่จ่ายค่าตอบแทน ไม่ขอความยินยอม แต่เป็นค่าธรรมเนียมเข้าเว็บไซต์

ผลลัพธ์: ภาพที่ทำป้ายกำกับแล้วนับพันล้านภาพ ครอบคลุมทั่วโลก ทุกสภาพอากาศ ทุกช่วงเวลา ทุกเมืองบนโลก

ไม่มีบริษัททำป้ายกำกับใดทำได้แบบนี้ อินเทอร์เน็ตเองคือโรงงานแห่งนี้ และทุกคนในนั้นคือพนักงานที่ไม่ได้เซ็นสัญญาใด ๆ

图像

สิ่งที่คุณยังทำอยู่ในวันนี้

reCAPTCHA v3 ที่เปิดตัวในปี 2018 ไม่แสดงการท้าทายใด ๆ ให้คุณทำ มันวิเคราะห์พฤติกรรมของคุณ เช่น การเคลื่อนเมาส์ การเลื่อนหน้า การวางเมาส์ไว้บนจอเป็นเวลานาน ข้อมูลพฤติกรรมนี้บอกให้มันรู้ว่าคุณเป็นมนุษย์หรือไม่

ข้อมูลพฤติกรรมเหล่านี้ก็ถูกส่งกลับไปยังระบบ AI ของกูเกิลเช่นกัน

คุณไม่เคยเลือกเข้าร่วมเอง ไม่มีช่องให้ติ๊กเลือก ในปัจจุบัน บนเว็บไซต์ส่วนใหญ่ที่คุณเข้าใช้งาน คุณก็ยังคงทำเช่นนี้อยู่

การสะท้อนที่น่าขบคิดอย่างสุดซึ้ง

แนวคิดของลูอิส ฟง-อันในตอนแรกเป็นความคิดอัจฉริยะ: การนำความสามารถด้านการรับรู้ที่มนุษย์ใช้ไปกับการกรองสแปม ไปใช้ในสิ่งที่มีคุณค่าจริง ๆ — การดิจิไทซ์หนังสือทั่วโลก แก้ปัญหาที่แท้จริง

แต่การใช้งานแนวคิดนี้ของกูเกิลเป็นอีกเรื่องหนึ่ง

พวกเขาเอาเครื่องมือความปลอดภัยที่ผู้ใช้ไม่มีทางเลือก ต้องใช้ แล้วนำไปใช้ทั่วอินเทอร์เน็ต พร้อมกับเก็บเกี่ยวผลลัพธ์ สร้างผลิตภัณฑ์เชิงพาณิชย์มูลค่าหลายร้อยล้านดอลลาร์

ผู้ใช้ไม่ได้อะไรเลย แม้แต่สิทธิ์ในการรับรู้ความจริง

ที่สุดแล้ว ความสุดยอดของความเสียดายคือ: คุณใช้เวลานานหลายปีในการพิสูจน์ว่าคุณเป็นมนุษย์ — ด้วยการทำงานด้านการรับรู้ภาพที่ AI ในตอนนั้นยังทำไม่ได้ แต่เมื่อ AI เรียนรู้แล้ว งานด้านการรับรู้ของมนุษย์ก็กลายเป็นสิ่งที่ไม่จำเป็นอีกต่อไป

คุณพิสูจน์ว่าคุณเป็นมนุษย์ โดยการทำให้ตัวเองกลายเป็นสิ่งที่สามารถถูกแทนที่ได้

ดูต้นฉบับ
news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น