IT News
ยุคใหม่ของปัญญาประดิษฐ์ (AI): Generative AI โดย JC Hsu รองประธานกรรมการองค์กรและผู้จัดการทั่วไปหน่วยธุรกิจการสื่อสารไร้สาย MediaTek
การปฏิวัติในเทคโนโลยี AI ยังคงทำให้ผู้ใช้งานสามารถสร้างและรับประโยชน์จากเนื้อหาที่ลุ่มลึกมากขึ้น Generative AI กำลังนำการปฏิวัตินี้โดยการค้นพบมุมมองและความเป็นไปได้ใหม่ และนำเสนอระดับความคิดสร้างสรรค์ใหม่มาสู่ชีวิตประจำวันของเราอันเข้าถึงได้ง่ายกว่าที่เคย ประสบการณ์ผู้ใช้ก็ได้รับการเปลี่ยนแปลงไป ตั้งแต่การแสดงดนตรี งานศิลปะ และเอกสารข้อความที่สร้างขึ้นโดย AI ไปจนถึงการเขียนโปรแกรมและการสร้างโค้ดโดยใช้ AI เป็นตัวช่วย
เทรนด์ในแวดวงหลักๆ สำหรับการพัฒนา Generative AI นั้นคือโมเดลการประมวลผลภาษาธรรมชาติ (NLP: Natural Language Processing) เช่น ChatGPT ซึ่งเป็นโมเดลภาษาขนาดใหญ่ที่ออกแบบมาโดยเฉพาะสำหรับแชทบอท และโมเดลการเปลี่ยนตัวอักษรให้เป็นรูปภาพ เช่น Midjourney และ DALL-E ด้วยโซลูชันที่เปี่ยมล้นนวัตกรรมเหล่านี้ สิ่งที่เป็นไปไม่ได้ก่อนหน้านี้ก็อยู่ใกล้แค่เอื้อม ตอนนี้เราสามารถสร้างสรรค์ภาพอันน่าทึ่งตามคำอธิบายที่เป็นข้อความ และสร้างบทสนทนาเสมือนจริงผ่านอินเทอร์เฟซแชทบอทอย่างง่าย ทำให้ไม่มีขีดจำกัดของความเป็นไปได้เพราะเราสามารถเข้าถึงแหล่งความคิดสร้างสรรค์ใหม่ๆ จากทั้งเครื่องจักรและมนุษย์ ศักยภาพของ Generative AI เพิ่งเริ่มต้นเท่านั้น
Generative AI ใช้โมเดล Transformer
Transformer เป็นโมเดล AI สุดล้ำในการประมวลผลภาษาธรรมชาติ เปิดตัวในปี 2560 และกลายเป็นโมเดลพื้นฐานของ Generative AI ตั้งแต่นั้นเป็นต้นมา ในปี 2563 Transformer ได้ขยายไปสู่ภาพและเสียง แสดงให้เห็นถึงประสิทธิภาพที่เหนือกว่าเมื่อเทียบกับโซลูชันอื่น เช่น โครงข่ายประสาทเทียมแบบคอนโวลูชัน (CNN: Convolutional Neural Networks) และเครือข่ายประสาทเทียมแบบวนกลับ (RNN: Recurrent Neural Networks) ในแง่ของความแม่นยำและคุณภาพ
ตั้งแต่ปี 2564 AI Processing Unit (APU) ของ MediaTek ได้รับการพัฒนาให้รองรับโมเดล Transformer และแบรนด์สมาร์ทโฟนต่างใช้เพื่อนำแอปพลิเคชันภาพและเสียงออกสู่ตลาด ด้วยความร่วมมือกับบริษัทมือถือชั้นนำ MediaTek กำลังพัฒนาวิธีที่เราโต้ตอบกับสมาร์ทโฟนในเชิงรุกด้วยแอป AI ที่ใช้โมเดล Transformer
MediaTek APU และ NeuroPilot พร้อมรับ Transformer
NeuroPilot แพลตฟอร์ม AI ของ MediaTek เป็นโซลูชันที่ครอบคลุมสำหรับการปรับใช้แอปพลิเคชัน AI ที่ใช้ Transformer ได้รับการออกแบบมาเพื่อรองรับโฟลว์การคำนวณที่ซับซ้อนของโมเดลเหล่านี้ ในขณะเดียวกันก็ใช้ประโยชน์จากการออกแบบ APU ของ MediaTek ที่ลดแบนด์วิดธ์ DRAM เพื่อให้ได้ประสิทธิภาพ SoC และการประหยัดพลังงานที่ดีที่สุด NeuroPilot มีชุดอุปกรณ์อันทรงพลังแบบผสานรวมที่ช่วยให้การพัฒนาและการปรับใช้โมเดล AI ง่ายขึ้น ด้วยการดำเนินการแบบครบวงจรของโมเดล Transformer AI บน APU ด้วย NeuroPilot ทำให้ดีเวลลอปเปอร์มีทุกสิ่งที่ต้องการเพื่อสร้างแอปพลิเคชันที่ใช้ Transformer ที่ล้ำสมัยได้อย่างรวดเร็วและง่ายดาย
MediaTek NeuroPilot พร้อมที่จะช่วยให้ผู้ผลิตใช้ประโยชน์จากประสิทธิภาพของ Vision Transformer (ViT) และ Voice Transformer ที่ได้รับการพิสูจน์แล้วของ APU
การใช้งานจริงและคุณสมบัติที่ได้
vivo X90 Pro สมาร์ทโฟนรุ่นใหม่สุดล้ำที่ใช้ MediaTek Dimensity 9200 ชิปสมาร์ทโฟน 5G เรือธงรุ่นล่าสุดของเราที่มี MediaTek APU 690 ตัวใหม่ สร้างมาตรฐานใหม่สำหรับการถ่ายภาพและจดจำเสียงของอุปกรณ์มือถือผ่านการใช้นวัตกรรมเทคโนโลยี Vision และ Voice Transformer
ด้วยประโยชน์จากเทคโนโลยี ViT ทำให้ vivo X90 Pro สามารถเข้าถึงความแม่นยำอย่างไม่เคยมีมาก่อนในการแบ่งส่วนวัตถุ ทำให้สามารถปรับและแก้ไขการภาพถ่ายและวิดีโอในระดับวัตถุได้ ปรับปรุงการถ่ายภาพในสภาวะแสงน้อยได้อย่างดีเยี่ยม เทคโนโลยี ViT ยังสามารถแยกตัวบุคคลออกจากพื้นหลังได้อย่างแม่นยำ (การถ่ายภาพพอร์ตเทรต) ละเอียดแม้กระทั่งเส้นผม จากนั้นใช้ฟิลเตอร์พื้นหลังต่างๆ แบบเรียลไทม์เพื่อสร้างเอฟเฟกต์พิเศษที่น่าทึ่งซึ่งทำให้ X90 Pro แตกต่างจากคู่แข่งอย่างแท้จริงในการถ่ายวิดีโอและการไลฟ์สด
แพลตฟอร์ม Dimensity 9200 ยังมี Voice AI ที่ใช้ Transformer ซึ่งมีคุณสมบัติการจดจำเสียงอัตโนมัติในตัวอุปกรณ์ ยกระดับความเร็วในการตอบสนองและความเป็นส่วนตัวของผู้ใช้ไปอีกขั้น โดยรับประกันว่าข้อมูลจะไม่ถูกส่งไปยังคลาวด์เพื่อประมวลผล เทคโนโลยีที่ล้ำสมัยนี้นับเป็นครั้งแรกที่โมเดล Transformer Voice AI ได้รับการพัฒนาให้เหมาะกับการใช้งานบน APU สำหรับมือถือ โดยประหยัดพลังงานมากขึ้น 30% และมีประสิทธิภาพการทำงานดีขึ้น 50% เมื่อเทียบกับโซลูชัน CPU รุ่นก่อนหน้า