- การผสานรวม Tensor ML SDK เข้ากับ LiteRT อย่างสมบูรณ์เพื่อเพิ่มประสิทธิภาพการใช้งานโมเดล AI บนอุปกรณ์ Pixel
- เข้าถึงคลังโมเดลที่มีโมเดลมากกว่า 100 แบบ ซึ่งได้รับการปรับแต่งให้เหมาะสมกับ Google Tensor TPU
- รองรับโมเดลภาษาและภาพแบบมัลติโมดอลขั้นสูงผ่านสถาปัตยกรรม Gemma 4
- ความสามารถในการประมวลผลข้อมูลด้วยความเร็วสูงและรักษาความเป็นส่วนตัวด้วยฮาร์ดแวร์ Tensor G5
หากคุณสนใจการพัฒนาแอปพลิเคชันและปัญญาประดิษฐ์ คุณคงสังเกตเห็นว่าวงการกำลังเปลี่ยนแปลงไป Google ได้ตัดสินใจเปิดโอกาสให้เข้าถึงฮาร์ดแวร์ที่ทรงพลังที่สุดของตนด้วย ซอฟต์แวร์พัฒนา เดล Tensor ML SDKเครื่องมือที่ช่วยให้นักพัฒนาสามารถใช้ประโยชน์จากหน่วยประมวลผลเทนเซอร์ (TPU) ของอุปกรณ์ Pixel ได้อย่างเต็มที่ ทำให้ AI ไม่ต้องพึ่งพาระบบคลาวด์ แต่ทำงานโดยตรงบนอุปกรณ์ได้
สิ่งที่น่าตื่นเต้นที่สุดคือ SDK นี้ได้ก้าวพ้นช่วงทดลองและเข้าสู่ขั้นตอนการใช้งานจริงแล้ว ขั้นตอนเบต้านี่หมายความว่ามันไม่ได้จำกัดอยู่แค่คนกลุ่มเล็กๆ อีกต่อไปแล้ว โปรแกรมเมอร์ทุกคนสามารถเริ่มสร้างประสบการณ์ AI ที่โต้ตอบได้ เป็นส่วนตัว และเหนือสิ่งอื่นใดคือรวดเร็วอย่างเหลือเชื่อ โดยใช้สถาปัตยกรรม Tensor SoC ของ Google เพื่อเรียกใช้งานต่างๆ ที่ก่อนหน้านี้ดูเหมือนจะเป็นไปไม่ได้ที่จะทำได้ในเครื่องคอมพิวเตอร์ส่วนบุคคล
ขั้นตอนการทำงานที่เป็นหนึ่งเดียวด้วย LiteRT
เพื่อป้องกันไม่ให้นักพัฒนาซอฟต์แวร์ปวดหัวกับการตั้งค่าที่ซับซ้อน Google จึงได้ผสานรวม Tensor SDK เข้ากับ... ไลท์อาร์ทีเฟรมเวิร์กนี้ทำหน้าที่เป็นเลเยอร์นามธรรมที่ช่วยขจัดความจำเป็นในการจัดการกับ SDK เฉพาะของผู้จำหน่ายหรือคอมไพเลอร์ที่ซับซ้อน โดยนำเสนอ API ที่เรียบง่ายและสม่ำเสมอสำหรับการปรับใช้โมเดลแมชชีนเลิร์นนิงที่อุปกรณ์ปลายทาง
กระบวนการนี้โดยพื้นฐานแล้วแบ่งออกเป็นสามขั้นตอนหลัก ขั้นแรกคือ... การรวบรวมโมเดลซึ่งคุณสามารถแปลงโปรเจ็กต์ PyTorch ของคุณได้ หรือ TFLite ที่ใช้ TensorFlow ในไฟล์ไบนารีที่ปรับแต่งโดยใช้ LiteRT Torch จากนั้นก็มาถึง การปรับใช้โดยใช้ Play Feature Delivery และสิ่งที่เรียกว่า AI Packs เพื่อกระจายไลบรารีและโมเดลที่คอมไพล์แล้วภายในแอปพลิเคชันอย่างมีประสิทธิภาพ
สุดท้ายนี้ เรามาถึงขั้นตอนการดำเนินการอนุมานแล้ว ขอบคุณ... รันไทม์ LiteRTคุณสามารถเรียกใช้โมเดลของคุณบน TPU ได้ด้วยโค้ดเพียงไม่กี่บรรทัด ที่สำคัญที่สุดคือ ระบบมีความฉลาด: หากด้วยเหตุผลใดก็ตามที่ TPU ไม่สามารถใช้งานได้ คุณสามารถกำหนดค่าได้ กลไกการสำรองข้อมูล เพื่อให้ระบบถ่ายโอนภาระการทำงานไปยัง CPU หรือ GPU โดยอัตโนมัติ ทำให้มั่นใจได้ว่าแอปจะไม่ค้าง
สวนต้นแบบ: แคตตาล็อกแห่งความเป็นไปได้
ไม่จำเป็นต้องเริ่มต้นใหม่ทั้งหมด เพราะ SDK เวอร์ชันเบต้ามีส่วนประกอบที่จำเป็นอยู่แล้ว สวนจำลอง น่าประทับใจมาก นี่คือคลังข้อมูลที่มีโมเดลมากกว่า 100 แบบ ทั้งแมชชีนเลิร์นนิงแบบคลาสสิกและปัญญาประดิษฐ์เชิงสร้างสรรค์ รวมถึงเวอร์ชันต่างๆ ของ เจมม่า 3 1Bนอกเหนือจากโมเดลสำเร็จรูปจำนวนมากที่คุณสามารถดาวน์โหลดได้โดยตรงจากชุมชน Hugging Face บน LiteRT แล้ว
หากคุณต้องการสร้างฟังก์ชันข้อความ โมเดลภาษาขนาดเล็ก เช่น ฟังก์ชันเจมม่า พวกมันช่วยให้คุณสามารถดำเนินการต่างๆ ภายในแอปได้ ในขณะที่ EmbeddingGemma เพิ่มความสามารถเชิงความหมายขั้นสูง ในด้านภาพนั้น SDK ช่วยให้คุณสามารถใช้งานได้ การตรวจจับวัตถุและการสร้างแผนที่ความลึกซึ่งนับว่ามีค่าอย่างยิ่งสำหรับแอปพลิเคชันกล้องที่ต้องการตอบสนองต่อสภาพแวดล้อมของผู้ใช้แบบเรียลไทม์
พวกเขายังไม่ลืมเรื่องเสียงและการเข้าถึงสำหรับผู้พิการด้วย ปัจจุบันสามารถใช้งานได้แล้ว การจดจำเสียงแบบครบวงจรสิ่งนี้รับประกันการถอดเสียงด้วยความหน่วงต่ำมาก และเครื่องมือแปลที่ทำงานแบบออฟไลน์ ช่วยรักษาความเป็นส่วนตัวของข้อมูล เนื่องจากไม่มีข้อมูลใดออกจากโทรศัพท์
การเพิ่มประสิทธิภาพทางเทคนิคและการสนับสนุนฮาร์ดแวร์
เพื่อให้ได้ประโยชน์สูงสุด จำเป็นต้องทราบว่าฮาร์ดแวร์ใดบ้างที่รองรับ ปัจจุบัน ระบบนิเวศนี้เน้นไปที่อุปกรณ์ภายในครอบครัวเป็นหลัก พิกเซล 10รวมถึงรุ่น Pro, Pro XL และ Pro Fold ซึ่งทั้งหมดติดตั้งชิป SoC ดังกล่าว Google เทนเซอร์ G5เพื่อให้ AI ทำงานได้อย่างราบรื่น Google แนะนำให้ใช้แฟล็กการปรับแต่งเฉพาะระหว่างการคอมไพล์
ตัวอย่างเช่น ในขั้นตอนการทำงานของ LiteRT Python การใช้แฟล็กเป็นเรื่องปกติมาก google_tensor_truncation_type=”half” เพื่อปรับประสิทธิภาพและการใช้ทรัพยากร ในกรณีของแบบจำลองภาษาขนาดใหญ่ (LLM) การส่งออกต้องใช้พารามิเตอร์โดยละเอียด เช่น การกำหนดค่าของ สูตรการหาปริมาณ และการเปิดใช้งานการสนับสนุนสำหรับโมเดลขนาดใหญ่ผ่านพจนานุกรมการกำหนดค่า AOT
สิ่งสำคัญที่ควรกล่าวถึงคือ แม้ว่า NNAPI จะเคยมีอยู่มาก่อน แต่ก็ล้าสมัยไปแล้วนับตั้งแต่นี้เป็นต้นไป Android 15กลยุทธ์ในขณะนี้คือการส่งผ่านทุกอย่างผ่านตัวแทนของ LiteRT ซึ่งการสนับสนุน Pixel TPU กลายเป็นหัวใจสำคัญในการทดแทนการใช้งานแบบเก่าและสร้างฐานที่มั่นคง ประสิทธิภาพการใช้พลังงาน สูงกว่า
การปฏิวัติ Gemma 4 และ AI แบบมัลติโมดอล
มาพูดถึงเรื่องล่าสุดกันดีกว่า: การมาถึงของ เจมม่า 4 12Bแตกต่างจากโมเดลอื่นๆ ที่เชื่อมต่อตัวเข้ารหัสภาพเข้ากับโมเดลภาษา Gemma 4 ประมวลผลภาพโดยตรง สถาปัตยกรรมที่เรียบง่ายนี้ไม่เพียงแต่ช่วยลดการใช้ VRAM แต่ยังช่วยให้... การให้เหตุผลข้ามรูปแบบ ลื่นไหลและสอดคล้องกันมากขึ้น
ด้วยหน้าต่างบริบทของ โทเค็น 256Kโมเดลนี้สามารถจัดการกับการสนทนาที่ยาวนานพร้อมรูปภาพหลายภาพได้โดยไม่เสียสมาธิ นอกจากนี้ยังเผยแพร่ภายใต้ใบอนุญาตอีกด้วย Apache 2.0มีความยืดหยุ่นสูงมากสำหรับการใช้งานเชิงพาณิชย์และการแจกจ่ายซ้ำ ทำให้ AI แบบมัลติโมดอลสามารถทำงานบนแล็ปท็อปรุ่นใหม่โดยใช้การควอนไทเซชัน 4 หรือ 8 บิตได้
เป้าหมายของ Google ชัดเจน: ต้องการให้นักพัฒนาใช้โมเดลการถ่วงน้ำหนักแบบเปิดของตนเพื่อครองตลาดระบบนิเวศ โดยทำให้การใช้งาน AI ง่ายขึ้น ท้องถิ่นและทรงอิทธิพลสิ่งเหล่านี้ช่วยลดการพึ่งพา API ภายนอก และสร้างชุมชนที่เหนียวแน่นรอบฮาร์ดแวร์ Tensor และซอฟต์แวร์ LiteRT
ระบบนิเวศการพัฒนาสำหรับ Pixel ได้ก้าวไปอีกขั้นอย่างมีคุณภาพด้วยการรวมฮาร์ดแวร์ของ เทนเซอร์ G5 ด้วยความอเนกประสงค์ของ LiteRT และพลังของโมเดลต่างๆ เช่น Gemma 4 ซึ่งเป็นผลมาจากการเปลี่ยนผ่านสู่เวอร์ชันเบต้าของ SDK และแคตตาล็อกขนาดใหญ่ของโมเดลที่ได้รับการปรับแต่งล่วงหน้า ทำให้การสร้างแอปพลิเคชันที่ประมวลผลภาพ เสียง และภาษาได้อย่างเป็นส่วนตัวและรวดเร็วเป็นพิเศษ กลายเป็นความจริงที่เข้าถึงได้สำหรับโปรแกรมเมอร์ทุกคนแล้ว


