ภาษาแอฟริกันเป็นอย่างไรดิจิทัล

Anonim

การแปลภาษาแอฟริกันเป็นกระบวนการที่ซับซ้อน แต่จำเป็น ขณะนี้นักวิชาการและ บริษัท เทคโนโลยีสารสนเทศจากทั่วโลกกำลังทำงานร่วมกันเพื่อรวมภาษาใหม่ ๆ ในรูปแบบต่างๆของซอฟต์แวร์และเทคโนโลยี

แม้ว่าจะมีภาษาหลายพันภาษาที่พูดกันทั่วโลก แต่ภาษาอังกฤษหลายภาษาเช่นเดียวกับภาษาอังกฤษยังคงแพร่หลายอยู่โดยเฉพาะอย่างยิ่งเมื่อพูดถึงเครื่องมือและเทคโนโลยีดิจิทัล จนกระทั่งเมื่อไม่นานมานี้เครื่องมือสำหรับการแปลการสะกดและไวยากรณ์ถูกมุ่งเน้นไปที่ภาษาตะวันตกหลัก โฟกัสนี้กำลังเริ่มเปลี่ยนไปแม้ว่าจะช้าๆ แต่จะทำให้ชาวแอฟริกันเป็นภาษาดิจิทัลได้มากขึ้น

การพัฒนาเทคโนโลยีภาษามนุษย์

ภาษาพื้นเมืองในแอฟริกาในอดีตไม่ได้รับการยอมรับเหมือนกันเมื่อรวมเทคโนโลยีเข้าด้วยกัน อย่างไรก็ตามเนื่องจากเทคโนโลยียังคงเข้าสู่ตลาดแอฟริกาใหม่ ๆ บริษัท อื่น ๆ จะเห็นความจำเป็นในการปรับปรุงเทคโนโลยีภาษามนุษย์ (HLT) ในทวีปนี้ นี่เป็นสิ่งสำคัญสำหรับการพัฒนาเทคโนโลยีอย่างต่อเนื่องและการรักษารากฐานที่สำคัญของวัฒนธรรมในยุคดิจิทัล

ตามที่มหาวิทยาลัยแอริโซนาภาษาและเทคโนโลยีสารสนเทศพบกันทั่วโลกเป็นประจำจึงจำเป็นต้องมีการวิจัยที่เชี่ยวชาญและการพัฒนา: "ทุกภาษามาติดต่อกับเทคโนโลยีสารสนเทศหรือที่มนุษย์ต้องการโต้ตอบกับคอมพิวเตอร์ความต้องการภาษา (จัด) เพื่อให้สามารถจัดการและประมวลผลด้วยวิธีการคำนวณ นี้มักจะต้องใช้ความรู้กว้างไม่เพียง แต่เกี่ยวกับภาษาศาสตร์และวิธีการทำงานของภาษา แต่ยังเกี่ยวกับวิทยาการคอมพิวเตอร์และสาขาที่เกี่ยวข้อง.

Tech ลงทุนในภาษาแอฟริกัน

ด้วยเหตุนี้ บริษัท ขนาดใหญ่จำนวนมากรวมถึง บริษัท ยักษ์ใหญ่ด้านเทคโนโลยีเช่น Facebook และ Google จึงลงทุนใน HLT สำหรับภาษาแอฟริกัน (ถ้าเพียงเพื่อเพิ่มการเข้าถึงตลาดและผลกำไร) การเปลี่ยนแปลงที่เห็นได้ชัดเป็นครั้งแรกในรูปแบบของความสามารถในการใช้ Google ในภาษาแอฟริกาหลายภาษา บาง บริษัท เช่น Microsoft มีการรวมภาษาแอฟริกันไว้ในตัวตรวจสอบการสะกดและเครื่องมือไวยากรณ์

อย่างไรก็ตามยังมีหลุมฝังศพที่ขาดแคลนและต้องทำงานเป็นจำนวนมาก ในฐานะที่เป็นนักวิจัย Maria Keet ชี้ว่าการรวมภาษาใหม่เข้ากับเทคโนโลยีอย่างถูกต้องและมีความหมายไม่ใช่แค่เพียงการสลับและแทนที่จะต้องใช้วิธีการแบบบูรณาการ: "อะไรคือจุดที่ต้องค้นหาเว็บในภาษาอังกฤษ (ภาษาแอฟริกาใต้) คืออะไร? มีเพียงไม่กี่เอกสารออนไลน์ใน isiXhosa และอัลกอริทึมของเครื่องมือค้นหาไม่สามารถประมวลผลคำได้อย่างถูกต้องอย่างไรก็ตามเหตุใดจึงไม่แสดงผลลัพธ์ที่คุณต้องการ? "

ซับซ้อนกว่าที่ปรากฏ

Keet เน้นถึงความจำเป็นในการใช้เครื่องมือประมวลผลคำเพื่อรวมภาษาเหล่านี้ไว้ในตัวตรวจสอบการสะกดเพื่อช่วยทุกคนตั้งแต่เด็กนักเรียนไปจนถึงมืออาชีพในการเขียนเอกสารเอกสารข้อความและอีเมลในภาษาแม่ของพวกเขา

การทำแบบดิจิทัลในภาษาใดก็มีความซับซ้อนและต้องใช้การวิจัยและทดสอบก่อนที่จะถึงขั้นตอนการใช้งานโดยอัตโนมัติ ภาษาแอฟริกันยังต้องการการทำงานมากกว่าอังกฤษอย่างมาก

ในขณะที่กฎไวยากรณ์พื้นฐานใช้เป็นภาษาดิจิทัลภาษาอังกฤษหลายภาษาแอฟริกาประกอบด้วยประโยคที่ขึ้นอยู่กับบริบทของสถานการณ์มีคำกริยาที่ซับซ้อนและโครงสร้างประโยคและไม่สามารถเปิดใช้เครื่องมืออัตโนมัติโดยใช้ข้อมูลที่มีโครงสร้าง

เป็นผลให้นักวิจัยต้องสร้างเครื่องมือไวยากรณ์เพื่อสร้างประโยคพื้นฐาน ขั้นตอนเหล่านี้ทำงานโดยใช้อัลกอริทึมที่ซับซ้อนซึ่งดึงมาจากข้อความที่มีอยู่และนำเสนอประเด็นต่างๆเพิ่มเติม

ให้ข้อความที่มีอยู่

ที่หลักของการเรียนรู้ภาษาดิจิทัลทั้งหมดเป็นข้อความที่มีอยู่และขั้นตอนวิธีเหล่านี้ฟีดเหล่านี้ การค้นหาและเปรียบเทียบข้อความเหล่านี้เป็นเรื่องยากสำหรับภาษาแอฟริกันหลายภาษาทำให้มีความลำเอียงทางประวัติศาสตร์ต่อภาษาตะวันตกเมื่อเผยแพร่

ถึงแม้จะมีความยากลำบากองค์กรต่างๆในทวีปต่างๆก็เริ่มที่จะระบุและรวบรวมเอกสารภาษาพื้นเมืองที่มีคุณภาพสูงซึ่งไม่เพียง แต่รวมถึงการสะกดและไวยากรณ์ที่ถูกต้องเท่านั้น แต่ยังทันสมัยพอที่จะได้รับการพิจารณาในวันนี้ด้วย โดยปราศจากบริบททางวัฒนธรรมนี้อัลกอริทึมซอฟต์แวร์จะเสี่ยงต่อการถูกไม่ถูกต้องและไม่รู้สึกตัวเมื่ออยู่ในภาวะเลวร้ายที่สุด

ข้อมูลขนาดใหญ่และความพยายามร่วมกัน

กระบวนการนี้จึงขึ้นอยู่กับข้อมูลขนาดใหญ่และความพยายามร่วมกันจากหลาย ๆ ฝ่ายตั้งแต่นักวิจัยจนถึงยักษ์ใหญ่ด้านเทคนิค เนื่องจากบางองค์กรระบุตำราที่เกี่ยวข้องผู้เชี่ยวชาญด้านภาษาแอฟริกันจึงทำงานเกี่ยวกับอัลกอริทึมที่สามารถแปลได้อย่างถูกต้อง Tech แล้วรวมเอาไว้ในโครงการที่มีอยู่แล้วและช่วยพัฒนาเครื่องมือใหม่ ๆ เพื่อช่วยผู้ที่ต้องการได้มากที่สุด

และพวกเขากำลังดำเนินการอยู่แล้ว - การตรวจสอบการสะกดคำภาษาแอฟริกันบางตัวได้รับคะแนนความแม่นยำถึง 80% แล้ว

แม้ว่าขั้นตอนการแปลงภาษาแอฟริกันเป็นภาษาที่ซับซ้อนและต้องอาศัยความร่วมมือของบุคคลและองค์กรที่สำคัญต่างๆ แม้ว่าจะมีบทบาทสำคัญในการรักษาวัฒนธรรมการศึกษาและชีวิตประจำวันของผู้ใช้เครื่องมือดิจิทัลจะมีผลกระทบโดยตรงต่อคุณภาพชีวิตโดยเฉพาะอย่างยิ่งในสาขาต่างๆ เช่นการดูแลสุขภาพเนื่องจากความก้าวหน้าทางเทคโนโลยีสามารถช่วยลดอุปสรรคด้านภาษาระหว่างแพทย์และผู้ป่วยได้