เปิดตัว Language Weaver เทคโนโลยีแปลใหม่จาก RWS


ขอขอบคุณภาพจาก Language Weaver

เมื่อวันอังคารที่ผ่านมา (22 มิ.ย.) ปู๊นได้มีโอกาสส่องเทคโนโลยีใหม่ที่ RWS เพิ่งเปิดตัวไป ชื่อว่า "Language Weaver" มันคืออะไร และเป็นประโยชน์อย่างไร ติดตามกันได้ในบทความนี้ค่ะ


 

ผู้อยู่เบื้องหลัง Language Weaver

ภาพจากที่ประชุม Language Weaver วันที่ 22 มิถุนายน

วิทยากร 4 คนที่อยู่เบื้องหลังเทคโนโลยี Language Weaver คือ

  1. Mihal Vlad ตำแหน่ง Managing Director ฝ่าย AI and Machine Translation

  2. Dragos Munteanu ตำแหน่ง VP ฝ่าย Research and Product Development, Machine Learning ผู้พัฒนา MT หลักตั้งแต่รุ่นแรก

  3. Paraic Sheridan ตำแหน่ง VP, AI strategy and Operations เริ่มจับ MT ตั้งแต่ปี 1998

  4. John Tinsley ตำแหน่ง VP ฝ่าย AI Product and Marketing

ทุกคนเคยทำงานในโปรเจค Iconic Translation เหมือนกันหมดเลย (มันคืออะไร เดี๋ยวอ่านต่อไปจะรู้เอง)



Language Weaver คืออะไร


คือ MT platform ของ RWS โดยพัฒนาต่อยอดจาก Iconic Translations ที่ RWS ซื้อเมื่อเดือนมิถุนายน 2012 ชื่อนี้ได้รับแรงบันดาลใจมาจาก Warren Weaver บิดาของ Machine Translation (MT) ซึ่งในปี 1947 เคยพูดเรื่อง Machine translation ว่าเป็นการ decode และ Encode ซึ่งปัจจุบัน Machine Translation ก็เป็นอย่างนี้จริงๆ!


ภาพจากที่ประชุม Language Weaver วันที่ 22 มิถุนายน

ถ้าติดตามข่าวสารเทคโนโลยีงานแปล คงทราบดีว่า RWS เป็นส่วนหนึ่งของ Trados แล้ว ทั้งสองบริษัทจึงนำเทคโนโลยี Machine Translation (MT) ของตนมาใช้พัฒนาสุดยอด MT ที่ตอบสนองการใช้งานจริง ย้อนกลับไปในปี 2012 ทาง RWS เองเคยซื้อ MT ที่ชื่อ Iconic Translation มาใช้พัฒนา ในขณะที่ Trados ก็พัฒนาของตนเองโดยเริ่มจากศูนย์ ผลงานครั้งนี้จึงเกิดจากการบูรณาการเทคโนโลยีและความร่วมมือระหว่างทีมพัฒนา 2 ทีมเพื่อหาจุดร่วม จนกลายเป็น Language Weaver ที่เพิ่งเปิดตัวไป



Language Weaver คือ Last mile ของ MT

จะดีกว่ามั้ยถ้าผมเปิดอีเมลภาษารัสเซียแล้วมีปุ่ม Translate เพื่อแปลเป็นภาษาที่ผมเข้าใจได้เลย

ทุกวันนี้บริษัทหลายบริษัทมุ่งพัฒนา Machine Translation โดยอิงจาก Generic Model ผลลัพธ์ที่ได้อาจครอบคลุมสิ่งที่ลูกค้าปลายทางต้องการเพียงแค่ 80-90% บางเจ้าอาจได้แต่เปรียบเทียบ Model ที่ใช้อยู่กับ Model ประเภทอื่นๆ แต่ไม่ได้มองว่าลูกค้าต้องการอะไร Language Weaver จะช่วยลดอุปสรรคทางภาษาเพราะนำไปใช้ได้หลากหลายรูปแบบ ทั้งแปลอีเมล แปล CRM หรือจะนำไปใช้กับ Translation Management System (TMS) ก็ได้ โดยอยู่ในรูป API และ integration



Language Weaver ต่างกับเจ้าอื่นอย่างไร


Language weaver เป็น Content Discovery Application ทีมผู้พัฒนามองว่า Machine Translation เป็นแค่ส่วนประกอบหนึ่งของกระบวนการทั้งหมด สิ่งที่ Language Weaver ทำคือประมวลผล content ก่อนส่งเข้า MT และหลังออกจาก MT ดังนั้นแพลตฟอร์มนี้จึงออกแบบมาเพื่อแก้ปัญหาตลอดทั้ง Value chain


ความเชี่ยวชาญของ Language Weaver อยู่ที่ “Adaptation” (การแปลงหรือปรับตัว) Language Weaver ใช้โมเดลแปลแบบ Neural MT ที่เอื้อให้ผู้ใช้ปรับแต่งค่าเองได้ เช่น ใส่พจนานุกรมส่วนตัว มีกระบวนการประมวลผลข้อมูลนำเข้า (Data processing) ลดเพศสภาพทางภาษา (Generalization เพื่อลด Gender bias MT ปัญหาที่ภาษาไทยไม่มี) สมมุติลูกค้าบางรายมีปัญหาเรื่องแปลตัวเลขหรือคำที่เกี่ยวข้องกับแบรนด์ Language Weaver จะช่วยวิเคราะห์ต้นฉบับและหยิบยกประเด็นนี้ ลูกค้าสามารถปรับแต่งค่าการประมวลผลได้เลย นอกจากนี้ยังอาศัยนักแปลจริงๆ ช่วยแปลงาน โดยให้ Language Weaver ช่วยวิเคราะห์ต้นฉบับก่อนส่งให้นักแปลตาม Domain ที่เกี่ยวข้อง งานนี้จึงไม่ได้มีแค่ MT แต่มี AI มาเกี่ยวข้องด้วย


ตัวอย่างเทคโนโลยีที่เราจะได้จาก Language Weaver มีดังนี้


  • Neural Machine Translation

  • MT Quality Estimation ประเมินคุณภาพของ MT ช่วยให้กระบวนการ Post-editing มีประสิทธิภาพมากกว่าเดิม จะต่างจาก MTQE ของ Memsource หรือไม่นั้น ต้องติดตามกันต่อไป

  • Multilingual Summarization

  • Named Entity Recognition

  • Sentiment Analysis

  • Text Generation

  • Text Simplification and Paraphrasing

  • Question Answering

  • Topic and Style Analysis



ก้าวถัดไป


RWS จะนำงานวิจัยเบื้องหลังการพัฒนา Language Weaver มาเสนอที่งานประชุม Machine Translation Summit เดือนสิงหาคมนี้ ใครที่สนใจโปรดติดตามต่อไป ส่วนคนที่อยากรู้ว่า Language Weaver มีดีอย่างไร จะออกมาใช้งานจริงแบบไหนบ้าง อย่าลืมลงทะเบียนเข้าร่วม Webinar ครั้งถัดไปได้ทาง https://www.languageweaver.com/ ทาง RWS จะจัดอีก 4 ครั้ง ทุกวันอังคาร เนื้อหาตามนี้จ้า


29 มิถุนายน Enabling Global Enterprises

6 กรกฎาคม APIs, Portals, connectors

13 กรกฎาคม Supporting Government and public sector

20 กรกฎาคม MT and AI innovation

29 กรกฎาคม Language Weaver for Legal

ภาพจากที่ประชุม Language Weaver วันที่ 22 มิถุนายน

ขอบคุณ RWS และผู้พัฒนาทุกคน

ดู 223 ครั้ง