Google กำลังบูรณาการ AI เข้ากับผลิตภัณฑ์และโครงสร้างพื้นฐานอย่างเข้มข้น คล้ายกับความพยายามของ Amazon, Microsoft, Anthropic และ OpenAI ที่ลงทุนอย่างหนักใน AI Demis Hassabis ซีอีโอของ Google DeepMind มีความตื่นเต้นกับ Gemini 2
อุตสาหกรรมเทคโนโลยีพึ่งพา AI มากขึ้นเรื่อย ๆ โดยมีนวัตกรรมถูกรวมเข้ากับชีวิตประจำวัน เมื่อเราเข้าใกล้ปี 2025 การเปิดตัวผลิตภัณฑ์ AI มีอยู่มากมาย OpenAI ได้เปิดตัวโปรแกรมสร้างวิดีโอเสมือนจริงชื่อ Sora และ Reddit ได้เปิดตัวเครื่องมือค้นหา AI ขณะเดียวกัน Google เปิดตัวชิปคอมพิวเตอร์ควอนตัมชื่อ Willow เพื่อเสริมศักยภาพ AI Microsoft ซึ่งเป็นผู้เล่นสำคัญใน AI ได้เข้าซื้อ Inflection AI และเปิดตัว Copilot Vision ซึ่งเป็นเครื่องมือ AI ที่ช่วยให้แชทบอทสามารถตีความภาพบนเว็บผ่านบราวเซอร์อินเทอร์เน็ต เครื่องมือนี้อยู่ในขั้นพรีวิวและจำกัดให้ผู้ใช้บางคนเท่านั้น แม้ว่า Copilot Vision จะมีข้อจำกัดบ้าง แต่ก็ได้รับคำชมเนื่องจากทำงานได้เฉพาะกับเว็บไซต์บางแห่งและต้องใช้บราวเซอร์ Edge ศักยภาพของมันนั้นกว้างขวาง อาจนำไปสู่เพื่อนร่วมทาง AI ที่ช่วยในการค้นหาเว็บและการโต้ตอบในชีวิตประจำวัน Mustafa Suleyman จาก Microsoft เห็นว่า AI เป็นการเปลี่ยนแปลงใหญ่ โดยคาดการณ์ว่าเมื่อ AI พัฒนาไป มันจะช่วยสนับสนุนการสนทนาโต้ตอบและการดำเนินการที่เป็นธรรมชาติบนเว็บ Suleyman ยังชี้ให้เห็นว่าศักยภาพของ AI ในการเสนอบริการที่ไม่สามารถบรรลุได้ก่อนหน้านี้ด้วยอินเทอร์เฟซแบบดั้งเดิม เขาเห็นว่า AI จะก้าวหน้าผ่านเทคโนโลยีสวมใส่ที่อาจลดการพึ่งพาหน้าจอ สะท้อนถึงการพัฒนาไปสู่การโต้ตอบระหว่างมนุษย์กับคอมพิวเตอร์ที่มีความเป็นธรรมชาติมากขึ้น การพัฒนานี้จะเป็นอนาคตที่น่าตื่นเต้นสำหรับ AI ทั้งในที่ทำงานและในบ้าน ช่วยในการทำงานจากการสรุปข้อมูลจนถึงการตอบคำถามส่วนบุคคล ด้วยความเร็วและความแม่นยำที่มากกว่าเดิม
ในเหตุการณ์ล่าสุด มีการหลอกลวงที่ใช้ปัญญาประดิษฐ์และการขโมยข้อมูลส่วนตัวเพื่อฟื้นฟูเว็บไซต์ Ashland Daily Tidings ในรัฐโอเรกอน โดยสำนักข่าวปลอมนี้แสร้งเป็นแหล่งข่าวที่น่าเชื่อถือพร้อมทีมผู้สื่อข่าว รวมถึง Joe Minihane ซึ่งข้อมูลส่วนตัวของเขาถูกขโมยมาเพื่อใช้ในวัตถุประสงค์นี้ Tidings ถูกปิดในปี 2023 เนื่องจากการลดลงของงานด้านวารสารศาสตร์ท้องถิ่นและรายได้จากการโฆษณา ผู้ปฏิบัติการหลอกลวงได้เปลี่ยนเว็บใหม่ให้เต็มไปด้วยบทความที่สร้างขึ้นจาก AI โดยนำเสนอชิ้นงานที่ลอกเลียนมาเป็นข่าวที่ถูกต้องเพื่อหลอกลวงผู้อ่านให้สร้างรายได้จากโฆษณา เรื่องนี้แสดงถึงแนวโน้มที่กว้างขวางขึ้นของการหลอกลวงที่ขับเคลื่อนด้วย AI ที่เป็นภัยต่อวารสารศาสตร์ ซึ่งเว็บไซต์ปลอมใช้เครื่องมือ AI เพื่อบรรจุข่าวจริงใหม่เพื่อหวังผลกำไร ความพยายามในการต่อสู้กับการหลอกลวงนี้ เช่น การดำเนินคดีทางกฎหมายและการที่ Google ถอนโฆษณา ต้องเผชิญกับความท้าทายเนื่องจากธรรมชาติระหว่างประเทศของผู้กระทำผิด สถานการณ์นี้สะท้อนถึงปัญหาใหญ่ในวารสารศาสตร์ท้องถิ่น เมื่อรูปแบบการหารายได้แบบเดิมลดลงและบริษัทเทคโนโลยีใช้ AI เพื่อรบกวนตลาด สำนักข่าวอิสระท้องถิ่นเช่น Ashland
Google ได้เปิดตัวชิปคอมพิวเตอร์ควอนตัมใหม่ล่าสุดที่มีชื่อว่า Willow โดยอ้างว่าสามารถพัฒนาในการแก้ไขข้อผิดพลาดและพลังการประมวลผลได้อย่างยอดเยี่ยม สามารถทำงานที่ซับซ้อนภายในห้านาที ซึ่งเป็นสิ่งที่ซูเปอร์คอมพิวเตอร์ที่ดีที่สุดในวันนี้ต้องใช้เวลาถึง 10 เซ็กซ์ทิลเลียนปี ซึ่งเกินอายุของจักรวาล นี่เป็นการพัฒนาที่สำคัญจากการอ้างอิงของ Google ในปี 2019 ว่าตัวประมวลผลควอนตัม Sycamore ของพวกเขาสามารถแก้สมการภายในสามนาที เทียบกับ 10,000 ปีบนซูเปอร์คอมพิวเตอร์ แม้ว่าในขณะนั้น IBM ได้ท้าทายว่าเป็นการกล่าวอ้างที่เกินคาด พัฒนาการล่าสุดนี้ชี้ถึงก้าวที่สำคัญในการสร้างคอมพิวเตอร์ควอนตัมขนาดใหญ่ที่สามารถจัดการกับปัญหาทางวิทยาศาสตร์และสังคมที่ซับซ้อนได้ ต่างจากคอมพิวเตอร์ทั่วไปที่สามารถประมวลผลข้อมูลจำนวนมากพร้อมกันอย่างมีประสิทธิภาพ อาจเป็นการเปลี่ยนแปลงในหลายสาขา เช่น วิทยาศาสตร์ การแพทย์ พลังงาน และ AI อย่างไรก็ตาม คอมพิวเตอร์ควอนตัมมักประสบกับปัญหาข้อผิดพลาดเนื่องจากความไม่เสถียรของคิวบิต ซึ่งเป็นหน่วยพื้นฐานของการคำนวณควอนตัม Google ระบุว่า Willow มี 105 คิวบิต แก้ปัญหานี้โดยการเพิ่มคิวบิตเพื่อลดข้อผิดพลาด "อย่างทวีคูณ" "ยิ่งเราใช้คิวบิตใน Willow มากเท่าไร เรายิ่งลดข้อผิดพลาดได้มากขึ้น และระบบกลายเป็นควอนตัมมากขึ้น" ฮาร์ทมัท เนเวน ผู้ก่อตั้งและหัวหน้าของ Google Quantum AI กล่าวในบล็อกโพสต์เมื่อวันจันทร์ โดยเน้นถึงความก้าวหน้าในการแก้ไขข้อผิดพลาดควอนตัมที่พยายามปรับปรุงมาเกือบ 30 ปี Google ยังแชร์ผลงานของ Willow ในวารสาร Nature โดยมีวิดีโอสรุปด้านบนที่แสดงความสามารถของมัน "มองสู่อนาคตกับ Willow" จูเลี่ยน เคลลี่ ผู้อำนวยการฮาร์ดแวร์ของ Google Quantum AI กล่าวในวิดีโอ "เรามุ่งหวังจะสร้างคอมพิวเตอร์ควอนตัมที่มีการแก้ไขข้อผิดพลาดอย่างใหญ่ที่จะผลักดันขอบเขตวิทยาศาสตร์และสำรวจธรรมชาติ ด้วยการประยุกต์ในอนาคตในด้านเภสัชกรรม แบตเตอรี่ และพลังงานฟิวชัน เราตื่นเต้นที่จะเผชิญกับปัญหาที่ไม่สามารถแก้ไขได้ของวันพรุ่งนี้" เนเวนยังเน้นว่าหลักไมล์นี้เป็นงานสำคัญที่ดำเนินมานานกว่าสิบปี ช่วยในก้าวสู่การประยุกต์ในเชิงพาณิชย์อย่างสำคัญ
ในบทความนี้: โดย Jeffrey Dastin นิวยอร์ก (รอยเตอร์) - อัลฟาเบท บริษัทแม่ของกูเกิลซึ่งเป็นที่รู้จักจากนวัตกรรมในรถยนต์ไร้คนขับและคอมพิวเตอร์ควอนตัมกำลังเน้นการลงทุนครั้งใหญ่ที่สุดใกล้บ้าน: การค้นหาออนไลน์ ในการประชุม Reuters NEXT ในนิวยอร์ก รูธ โพแรต ประธานและประธานเจ้าหน้าที่การลงทุนของอัลฟาเบท เน้นย้ำว่าการใช้ปัญญาประดิษฐ์กับธุรกิจการค้นหาซึ่งเป็นธุรกิจหลักยังคงเป็นการลงทุนที่สำคัญที่สุดของบริษัท "เราเชื่อมต่อกับผู้คนในที่ที่พวกเขาต้องการไปต่อ" โพแรตกล่าวในการให้สัมภาษณ์กับ อเลสซานดรา กัลโลนี บรรณาธิการบริหารของรอยเตอร์ เมื่อมีรายได้ประจำปีมากกว่า 300 พันล้านดอลลาร์จากโฆษณาที่เกี่ยวกับการค้นหา อัลฟาเบทได้เปิดตัวการสรุปจาก AI สำหรับคำถามที่ขาดคำตอบที่ชัดเจนซึ่งเป็นส่วนหนึ่งของความพยายามเชิงกลยุทธ์ ความคิดริเริ่มนี้เกิดขึ้นหลังจากการแข่งขันจาก OpenAI ผู้สร้าง ChatGPT ที่ท้าทายกูเกิลให้จัดการกับประเด็นซับซ้อนของ "ภาพหลอน" ที่เกิดจาก AI ที่อาจมีข้อมูลที่ถูกสร้างขึ้น โพแรต ซึ่งเคยเป็น CFO ที่ดำรงตำแหน่งยาวนานที่สุดของกูเกิลและอัลฟาเบท กล่าวว่าการค้นหาจะพัฒนาต่อไป โดย Google Cloud เป็นอีกหนึ่งจุดลงทุนที่โดดเด่น หลังจากได้รับการวินิจฉัยว่าเป็นมะเร็งเต้านมถึงสองครั้ง โพแรตเน้นถึงความพยายามที่กว้างขวางของอัลฟาเบทในการพัฒนาการดูแลสุขภาพ เธอกล่าวถึง "AlphaFold" ซึ่งเป็น AI ที่ทำนายการพับของโปรตีน ช่วยในการค้นพบยาใหม่ผ่านแผนก Isomorphic Labs ของบริษัท AI สามารถรักษาสายตาสำหรับผู้ที่มีความเสี่ยงและลดเวลาหน้าจอของบุคลากรทางการแพทย์ เพื่อให้มีการสื่อสารกับผู้ป่วยมากขึ้น "มันสามารถคืนความเป็นมนุษย์ให้กับความสัมพันธ์ของแพทย์และผู้ป่วย" โพแรตกล่าวอ้างอิงจากความคาดหวังโดยแพทย์ของเธอ เมื่อถูกถามว่าการลงทุนใน AI ของอัลฟาเบทจะสอดคล้องกับแนวโน้มต้นทุนสูงของอุตสาหกรรมหรือไม่ โพแรตอธิบายว่า AI เป็น "โอกาสแห่งยุค" บริษัทวางแผนที่จะใช้จ่าย 50 พันล้านดอลลาร์ในการซื้อชิป ศูนย์ข้อมูล และค่าใช้จ่ายเกี่ยวกับทุนในปี 2024 ตามที่รายงานต่อผู้วิเคราะห์ เน้นว่าเงินลงทุนเหล่านี้จะขับเคลื่อนด้วยผลลัพธ์ "เราจำเป็นต้องสร้างผลตอบแทน" เธอยืนยัน (รายงานโดย Jeffrey Dastin ในนิวยอร์ก; แก้ไขโดย Leslie Adler, Rosalba O'Brien และ Sam Holmes)
ในการวิเคราะห์นี้ ข้าพเจ้าจะพูดถึงความตื่นเต้นในปัจจุบันเกี่ยวกับเทคโนโลยีเปลี่ยนข้อความเป็นวิดีโอ (Text-to-Video หรือ T2V) ในแอป AI สร้างสรรค์และโมเดลภาษาขนาดใหญ่ (LLMs) แม้ว่า T2V จะยังอยู่ในขั้นเริ่มต้น แต่คาดว่าจะมีความก้าวหน้าอย่างมาก เปลี่ยนแปลงวิธีการสร้างวิดีโออย่างมากมาย ผลิตภัณฑ์ที่โดดเด่นในพื้นที่นี้คือ Sora Turbo ของ OpenAI ซึ่งเป็นเครื่องมือแปลงข้อความเป็นวิดีโอที่ผู้ใช้ ChatGPT Plus และ Pro สามารถใช้งานได้ มีศักยภาพในการใช้งานจากผู้ใช้จำนวนมากและได้รับความสนใจจากสื่อ AI สร้างสรรค์เริ่มต้นด้วยความสามารถในการเปลี่ยนข้อความเป็นข้อความ (T2T) ที่ต่อยอดเป็นความสามารถในแปลงข้อความเป็นภาพ ขณะนี้เป้าหมายคือการสร้างวิดีโอจากข้อความในตอนแรกเน้นที่ภาพและอาจรวมถึงเสียงในอนาคต วัตถุประสงค์สูงสุดคือการป้อนสื่อใด ๆ และแปลงให้เป็นรูปแบบใดตามที่ต้องการ เรียกว่ารูปแบบ X-to-X ความท้าทายที่สำคัญใน T2V คือการทำให้วิดีโอที่สร้างขึ้นสะท้อนเจตนาของผู้ใช้อย่างถูกต้องหรือที่เรียกว่าความเหมาะสมหรือความซื่อสัตย์ เทคโนโลยี T2V ปัจจุบัน รวมถึง Sora Turbo ยังคงมีปัญหาในการสร้างวิดีโอที่ตรงกับความคาดหวังของผู้ใช้ได้อย่างสม่ำเสมอ โดยได้เกรดปานกลางในด้านความเหมาะสม คุณภาพของภาพ ความต่อเนื่อง และความคงทนของวัตถุ ปัญหาเช่นความต่อเนื่องตามเวลา ความคงทนของวัตถุ และการปฏิบัติตามฟิสิกส์ของฉากเป็นอุปสรรคสำหรับนักพัฒนา แม้ว่าจะมีการพัฒนาแล้ว แต่ผลลัพธ์ของ T2V มักจะสั้นและอาจขาดความต่อเนื่องในลำดับที่ยาวขึ้น อย่างไรก็ตาม Sora Turbo มีฟีเจอร์ขั้นสูงเช่นตัวเลือกสไตล์และการสร้างสตอรีบอร์ด แม้ว่าวิดีโอคุณภาพระดับภาพยนตร์เต็มรูปแบบยังคงเป็นความท้าทาย การเพิ่มขึ้นของเทคโนโลยี T2V ทำให้เกิดความกังวลเกี่ยวกับดีพเฟคและการใช้งานในทางที่ผิด เมื่อเครื่องมือ T2V มีความซับซ้อนและเข้าถึงได้ง่ายขึ้น ก็อาจเป็นไปได้ที่จะสร้างวิดีโอปลอมที่สมจริงในต้นทุนต่ำ ซึ่งอาจส่งผลกระทบต่อสังคม การอภิปรายเกี่ยวกับจริยธรรม AI กฎหมาย และความรับผิดชอบจึงมีความสำคัญเมื่อความสามารถของ AI ขยายออกไป OpenAI และผู้มีส่วนได้ส่วนเสียอื่น ๆ เน้นย้ำถึงความจำเป็นในการร่วมมือทางสังคมเพื่อพัฒนาบรรทัดฐานและมาตรการป้องกันเพื่อให้มั่นใจถึงการใช้เทคโนโลยี T2V อย่างมีความรับผิดชอบ การมีส่วนร่วมจากบุคคลทั่วไปในการอภิปรายเหล่านี้เป็นสิ่งสำคัญเพื่อชี้นำความก้าวหน้าของ AI ในทิศทางที่ดี เน้นย้ำถึงความสำคัญของความเหมาะสม—เพื่อให้แน่ใจว่าผลลัพธ์เป็นไปตามที่คาดหวังและเป็นประโยชน์
- 1