2 บทเรียนที่ควรรู้
1. เทคโนโลยี Qwen2-Math และ Qwen2-Audio
บทความนี้เกี่ยวกับการปล่อยโมเดล LLM แบบโอเพนซอร์สตระกูล Qwen 2 ที่พัฒนาขึ้นโดย Alibaba Cloud โดยมีรุ่น Qwen2-Math และ Qwen2-Audio เพิ่มเติม ซึ่งเป็นเทคโนโลยีที่มีความสามารถในการฝึกตัวเองและใช้งานสำหรับการวิเคราะห์ข้อมูลทางคณิตศาสตร์และเสียง
2. การใช้งานและความสามารถของ Qwen2-Math และ Qwen2-Audio
Qwen2-Math สามารถใช้งานเพื่อทำคะแนนทดสอบด้านคณิตศาสตร์ได้สูง เมื่อเปรียบเทียบกับโมเดลที่อื่น ๆ ในกลุ่มเดียวกัน ส่วน Qwen2-Audio เป็นโมเดลที่สามารถใช้งานสำหรับการแชตเสียงโดยตรง และรองรับการใช้งานใน 8 ภาษาต่าง ๆ
2 ปัญหาและวิธีการแก้ไข
1. การใช้งานเฉพาะภาษาอังกฤษของ Qwen2-Math
ปัญหาที่อยู่ใน Qwen2-Math คือการใช้งานได้เฉพาะในภาษาอังกฤษเท่านั้น วิธีการแก้ไขคือทีมงานกำลังพัฒนาเวอร์ชั่นในภาษาจีนเพื่อให้สามารถใช้งานกับภาษาอื่น ๆ ได้
2. ปรับปรุงสถาปัตยกรรมใหม่ของ Qwen2-Audio
Qwen2-Audio ได้มีการปรับปรุงสถาปัตยกรรมเพื่อรองรับเสียงโดยเฉพาะ และยังต้องมีการฝึกโมเดลเข้ากับชุดข้อมูลของงานที่เกี่ยวข้อง เพื่อแก้ไขปัญหาที่อาจจะเกิดขึ้น
3 คำถามที่ถามบ่อย
1. Qwen2-Math สามารถใช้งานสำหรับวิเคราะห์ข้อมูลใดบ้าง?
Qwen2-Math สามารถใช้งานในการวิเคราะห์ข้อมูลทางคณิตศาสตร์ เช่น ตัวเลข, สูตรคณิตศาสตร์ หรือแม้กระทั่งการทดสอบต่าง ๆ ที่เกี่ยวกับคณิตศาสตร์
2. Qwen2-Audio สามารถใช้งานในภาษาอะไรบ้าง?
Qwen2-Audio สามารถใช้งานใน 8 ภาษา ได้แก่ จีน, อังกฤษ, กวางตุ้ง, ฝรั่งเศส, อิตาลี, สเปน, เยอรมัน, และญี่ปุ่น
5 เว็บไซต์ที่เกี่ยวข้อง
1. Qwen2-Math
เว็บไซต์ที่เกี่ยวข้องกับ Qwen2-Math ซึ่งเป็นแหล่งข้อมูลเกี่ยวกับเทคโนโลยีทางคณิตศาสตร์
2. Qwen2-Audio
เว็บไซต์ที่เกี่ยวข้องกับ Qwen2-Audio ซึ่งเป็นแหล่งข้อมูลเกี่ยวกับเทคโนโลยีทางเสียง
5 คำค้นหาที่เกี่ยวข้อง
1. Qwen2-Math
คำค้นหาที่เกี่ยวข้องกับเทคโนโลยี Qwen2-Math ที่เปิดโอกาสให้ผู้ใช้ใช้งานในสาขาคณิตศาสตร์
2. Qwen2-Audio
คำค้นหาที่เกี่ยวข้องกับเทคโนโลยี Qwen2-Audio ที่เปิดโอกาสให้ผู้ใช้ใช้งานเทคโนโลยีเสียง
สรุป
การปล่อยโมเดล LLM แบบโอเพนซอร์สตระกูล Qwen 2 และการพัฒนาเทคโนโลยี Qwen2-Math และ Qwen2-Audio จะเป็นทางเลือกที่ดีสำหรับผู้ที่สนใจในการใช้งานข้อมูลทางคณิตศาสตร์และเสียงอย่างมีประสิทธิภาพ
Alibaba Cloud ปล่อยโมเดล LLM แบบโอเพนซอร์สตระกูล Qwen 2 เพิ่มอีกสองรุ่น ได้แก่ Qwen2-Math และ Qwen2-Audio
Qwen2-Math เป็นโมเดลที่ฝึกต่อจก Qwen2 โดยสร้างชุดข้อมูลคุณภาพสูงด้านคณิตศาสตร์เฉพาะ ทั้งหนังสือ, โค้ดต่างๆ, ชุดข้อสอบต่างๆ, จนถึงข้อมูลที่สังเคราะห์ออกมาจาก Qwen2 เอง จุดเด่นของโมเดลนี้คือทำคะแนนทดสอบด้านคณิตศาสตร์ เช่น GSM8K, MATH หรือ MMLU-STEM ได้สูงกว่าโมเดลปิดอย่าง GPT-4o หรือ Gemini เสียอีก
Qwen2-Math ยังใช้งานได้เฉพาะภาษาอังกฤษเท่านั้น และมี 3 ขนาด คือ 1.5B, 7B, 72B เปิดให้ใช้งานแบบสัญญาอนุญาต Apache 2.0 ทีมงานระบุว่าจะเปิดเวอร์ชั่นภาษาจีนเร็วๆ นี้
Qwen2-Audio เป็นโมเดลสำหรับแชตเป็นเสียงโดยตรง สามารถใส่เสียงอย่างเดียวหรือเสียงพร้อมข้อความได้ โดยข้อความสามารถใส่คำสั่งเกี่ยวกับเสียง เช่น การวิเคราะห์ว่าเป็นเสียงอะไร โมเดลนี้รองรับ 8 ภาษา ได้แก่ จีน, อังกฤษ, กวางตุ้ง, ฝรั่งเศส, อิตาลี, สเปน, เยอรมัน, และญี่ปุ่น
สถาปัตยกรรมของ Qwen2-Audio เปลี่ยน encoder ใหม่เพื่อรองรับเสียงโดยเฉาพะ และฝึกโมเดลเข้ากับชุดข้อมูลของงานประเภทต่างๆที่เกี่ยวกับเสียง
โมเดล Qwen2-Audio มีเพียงขนาดเดียว คือ 7B พร้อมรุ่น instruct แยกออกมา
ที่มา – Qwen2-Math, Qwen2-Audio
Source link
https://www.blognone.com/node/141360