Facebook ได้ประกาศโครงการวิจัยที่มีเป้าหมายเพื่อผลักดัน “ขอบเขตของการรับรู้ของบุคคลที่หนึ่ง” และในกระบวนการนี้จะช่วยให้คุณจำได้ว่าคุณลืมกุญแจไว้ที่ใด โครงการ Ego4D นำเสนอคอลเลกชันขนาดใหญ่ของวิดีโอมุมมองบุคคลที่หนึ่งและข้อมูลที่เกี่ยวข้อง รวมถึงชุดของความท้าทายสำหรับนักวิจัยในการสอนคอมพิวเตอร์ให้เข้าใจข้อมูลและรวบรวมข้อมูลที่เป็นประโยชน์จากข้อมูลดังกล่าว
ในเดือนกันยายน บริษัทโซเชียลมีเดียยักษ์ใหญ่ได้เปิดตัว
“แว่นตาอัจฉริยะ” ที่เรียกว่า Ray-Ban Stories ซึ่งมีกล้องดิจิทัล
และฟีเจอร์อื่นๆ เช่นเดียวกับ โครงการ Google Glassซึ่งได้รับการวิจารณ์ที่หลากหลายในปี 2013 โครงการนี้ได้แจ้งข้อร้องเรียนเกี่ยวกับการบุกรุกความเป็นส่วนตัว โครงการ Ego4D มีเป้าหมายเพื่อพัฒนาซอฟต์แวร์ที่จะทำให้แว่นตาอัจฉริยะมีประโยชน์มากขึ้น แต่ในกระบวนการนี้อาจทำให้มีการละเมิดความเป็นส่วนตัวมากขึ้น
ชุดข้อมูลขนาดมหึมาแบบ egocentric และชุดเกณฑ์มาตรฐานที่รวบรวมจาก 74 แห่งทั่วโลกและเก้าประเทศ พร้อมวิดีโอกิจกรรมในชีวิตประจำวันมากกว่า 3,025 ชั่วโมง
“อัตตา” ใน Ego4D หมายถึงการยึดถือตนเองเป็นศูนย์กลาง (หรือวิดีโอ “มุมมองบุคคลที่หนึ่ง”) ในขณะที่ “4D” หมายถึงสามมิติของพื้นที่และอีกหนึ่งมิติ: เวลา โดยพื้นฐานแล้ว Ego4D พยายามรวมภาพถ่าย วิดีโอ ข้อมูลทางภูมิศาสตร์ และข้อมูลอื่น ๆ เพื่อสร้างแบบจำลองของโลกของผู้ใช้
มีสององค์ประกอบ: ชุดข้อมูลขนาดใหญ่ของภาพถ่ายและวิดีโอมุมมองบุคคลที่หนึ่ง และ “ชุดมาตรฐาน” ที่ประกอบด้วยงานท้าทาย 5 งานที่สามารถใช้เปรียบเทียบโมเดล AI หรืออัลกอริทึมต่างๆ กันได้ การวัดประสิทธิภาพเหล่านี้เกี่ยวข้องกับการวิเคราะห์วิดีโอมุมมองบุคคลที่หนึ่งเพื่อจดจำเหตุการณ์ในอดีต สร้างบันทึกประจำวัน ทำความเข้าใจปฏิสัมพันธ์กับวัตถุและผู้คน และคาดการณ์เหตุการณ์ในอนาคต
ชุดข้อมูลประกอบด้วยวิดีโอมุมมองบุคคลที่หนึ่งความยาวกว่า 3,000 ชั่วโมงจากผู้เข้าร่วม 855 คนซึ่งทำกิจวัตรประจำวัน ถ่ายด้วยอุปกรณ์ที่หลากหลาย รวมถึงกล้อง GoPro และแว่นตาความจริงเสริม (AR) วิดีโอครอบคลุมกิจกรรมที่บ้าน ที่ทำงาน และการตั้งค่าทางสังคมหลายร้อยรายการ
แม้ว่านี่จะไม่ใช่ชุดข้อมูลวิดีโอชุดแรกที่ได้รับการแนะนำให้รู้จัก
กับชุมชนการวิจัย แต่ชุดข้อมูลนี้มีขนาดใหญ่กว่าชุดข้อมูลที่เปิดเผยต่อสาธารณะถึง 20 เท่า ซึ่งรวมถึงวิดีโอ เสียง การสแกนตาข่าย 3 มิติของสภาพแวดล้อม การจ้องตา สเตอริโอ และมุมมองกล้องหลายตัวที่ซิงโครไนซ์ของเหตุการณ์เดียวกัน
Facebook ยังได้พัฒนาความท้าทายห้าประการซึ่งเป็นส่วนหนึ่งของโครงการ Ego4D ความท้าทายมีเป้าหมายเพื่อสร้างความเข้าใจที่ดีขึ้นเกี่ยวกับสื่อวิดีโอเพื่อพัฒนาผู้ช่วย AI ที่เป็นประโยชน์ เกณฑ์มาตรฐานมุ่งเน้นไปที่การทำความเข้าใจการรับรู้ของบุคคลที่หนึ่ง เกณฑ์มาตรฐานอธิบายไว้ดังนี้:
ความจำที่เป็นตอนๆ (เกิดอะไรขึ้นเมื่อไหร่): เช่น การค้นหาจากวิดีโอมุมมองบุคคลที่หนึ่งที่คุณลืมกุญแจไว้
การจัดการวัตถุด้วยมือ (ฉันกำลังทำอะไรและอย่างไร): สิ่งนี้มีจุดมุ่งหมายเพื่อทำความเข้าใจและสอนการกระทำของมนุษย์ให้ดีขึ้น เช่น การให้คำแนะนำในการเล่นกลอง
การสนทนาด้วยภาพและเสียง (ใครพูดอะไรและเมื่อไหร่): ซึ่งรวมถึงการติดตามและสรุปการสนทนา การประชุม หรือชั้นเรียน
ปฏิสัมพันธ์ทางสังคม (ใครโต้ตอบกับใคร): นี่เป็นเรื่องเกี่ยวกับการระบุตัวบุคคลและการกระทำของพวกเขา โดยมีเป้าหมายในการทำสิ่งต่างๆ เช่น ช่วยให้คุณได้ยินคนๆ หนึ่งดีขึ้นหากพวกเขากำลังพูดกับคุณ
กิจกรรมการคาดการณ์ (ฉันน่าจะทำอะไรต่อไป): สิ่งนี้มีจุดมุ่งหมายเพื่อคาดการณ์ความตั้งใจของคุณและให้คำแนะนำ เช่น ระบุว่าคุณได้เติมเกลือลงในสูตรอาหารแล้ว หากคุณดูเหมือนว่ากำลังจะเพิ่มอีก
แล้วความเป็นส่วนตัวล่ะ?
เห็นได้ชัดว่ามีข้อกังวลที่สำคัญเกี่ยวกับความเป็นส่วนตัว หากเทคโนโลยีนี้จับคู่กับแว่นตาอัจฉริยะจะบันทึกและวิเคราะห์สภาพแวดล้อมอย่างต่อเนื่อง ผลลัพธ์อาจเป็นการติดตามและบันทึกอย่างต่อเนื่อง (ผ่านการจดจำใบหน้า) ของผู้คนที่เคลื่อนไหวไปมาในที่สาธารณะ
Facebook กล่าวว่าจะรักษามาตรฐานด้านจริยธรรมและความเป็นส่วนตัวระดับสูงสำหรับข้อมูลที่รวบรวมสำหรับโครงการ รวมถึงความยินยอมของผู้เข้าร่วม การตรวจสอบโดยอิสระ และการลบข้อมูลระบุตัวตนหากเป็นไปได้
ด้วยเหตุนี้ Facebook จึงกล่าวว่าข้อมูลดังกล่าวถูกบันทึกใน “สภาพแวดล้อมที่มีการควบคุมโดยได้รับความยินยอมที่ได้รับการบอกกล่าว” และในที่สาธารณะ “ใบหน้าและ PII อื่นๆ [ข้อมูลระบุตัวตน] จะถูกเบลอ”
แต่แม้จะมีการรับรองเหล่านี้ (และสังเกตว่านี่เป็นเพียงการทดลองเท่านั้น) ยังมีข้อ กังวลเกี่ยวกับอนาคตของเทคโนโลยีแว่นตาอัจฉริยะ ควบคู่ไปกับพลังของโซเชียลมีเดียยักษ์ใหญ่ที่ความตั้งใจไม่สอดคล้องกับผู้ใช้เสมอไป
เว็บแท้ / ดัมมี่ออนไลน์