Meta xây dựng bản dịch giọng nói được hỗ trợ bởi AI để Hokkien hiểu các ngôn ngữ không được viết

0
Meta xây dựng bản dịch giọng nói được hỗ trợ bởi AI để Hokkien hiểu các ngôn ngữ không được viết

Hầu hết các bản dịch trí tuệ nhân tạo cho đến nay đều tập trung vào các ngôn ngữ viết vì đó là cách dễ nhất để đào tạo các hệ thống máy học hiểu và dịch chúng. Tuy nhiên, hơn 40% trong số 7.000 ngôn ngữ sống trên thế giới không có hệ thống chữ viết chuẩn.

Nhóm nghiên cứu trí tuệ nhân tạo của Meta Platform Inc. tại Meta AI nói hôm nay rằng nó đã phát triển một hệ thống dịch thời gian thực hướng tới ngôn ngữ truyền miệng, với Hokkien là ngôn ngữ đầu tiên của nó.

Hokkien là một ngôn ngữ được sử dụng rộng rãi ở đông nam Trung Quốc đại lục và Đài Loan, và trong cộng đồng người Hoa hải ngoại ở Singapore, Indonesia, Malaysia, Philippines và các khu vực khác của Đông Nam Á. Nó cũng không có hệ thống chữ viết tiêu chuẩn và chủ yếu chỉ được nói. Do đó, nó đã trở thành một chủ đề hoàn hảo cho một dự án dịch thuật thời gian thực mới sẽ mở ra các kênh giao tiếp mới.

Nỗ lực này là một phần của Meta AI’s Trình dịch giọng nói phổ thông dự án, một mô hình ngôn ngữ máy cuối cùng sẽ cho phép dịch theo thời gian thực của nhiều ngôn ngữ nói và viết khác nhau, cho phép mọi người giao tiếp dễ dàng.

Đối với Peng-Jen Chen, một nhà nghiên cứu Meta AI, điều này đặc biệt gây chú ý vì anh lớn lên ở Đài Loan nói tiếng Quan Thoại, nhưng cha anh lại nói tiếng Đài Loan Hokkien. Mặc dù người nói hai ngôn ngữ có thể hiểu nhau, nhưng họ khác nhau đến mức việc giao tiếp có thể trở nên khó khăn khi tham gia vào các chủ đề phức tạp.

Chen nói: “Tôi luôn ước rằng cha tôi có thể giao tiếp với mọi người bằng tiếng Phúc Kiến Đài Loan, đây là ngôn ngữ mà ông ấy thoải mái nhất khi nói. “Anh ấy hiểu tốt tiếng Quan Thoại nhưng nói chậm hơn khi giao tiếp về các chủ đề phức tạp.”

Thách thức khi xây dựng mô hình mới là hầu hết các công nghệ AI dịch thời gian thực sử dụng ngôn ngữ viết làm cơ sở thu thập dữ liệu và chú thích cho mã hóa giọng nói. Ví dụ: tiếng Anh, tiếng Tây Ban Nha, tiếng Quan Thoại và các ngôn ngữ viết khác với nhiều người nói khiến việc khai thác dữ liệu và xây dựng các mô hình lớn tương đối đơn giản vì đã có các mô hình dịch AI được đào tạo tốt đã được chú thích với dữ liệu đào tạo chính xác.

Tuy nhiên, với một phương ngữ như tiếng Phúc Kiến, không có hệ thống chữ viết tiêu chuẩn và ít người nói để làm việc cùng. Điều này gây khó khăn cho việc xây dựng một mô hình dữ liệu rộng lớn. Do đó, các nhà nghiên cứu cần phải tìm ra một ngôn ngữ trung gian để làm cầu nối cho cả hai. Vì vậy, họ đã sử dụng tiếng Quan Thoại vì những điểm tương đồng của nó với tiếng Phúc Kiến để giúp xây dựng mô hình ban đầu.

Nhà nghiên cứu Juan Pino của Meta cho biết: “Đầu tiên nhóm chúng tôi dịch bài phát biểu tiếng Anh hoặc tiếng Phúc Kiến sang tiếng Quan Thoại, sau đó dịch nó sang tiếng Phúc Kiến hoặc tiếng Anh – bằng cả chú giải của con người và tự động”. “Sau đó, họ thêm các câu được ghép nối vào dữ liệu được sử dụng để đào tạo mô hình AI.”

Các nhà nghiên cứu cũng tích cực làm việc với những người nói tiếng Hokkien bản ngữ để đảm bảo rằng các mô hình dịch AI là chính xác.

Bản thân mô hình này vẫn đang trong quá trình hoàn thiện và sẽ chỉ hoạt động với các ngôn ngữ có ngôn ngữ “cầu nối” cho phép dịch văn bản sang giọng nói. Các ngôn ngữ không có ngôn ngữ gần giống nhau có thể được bắc cầu sẽ không thể dễ dàng tận dụng mô hình mới này, nhưng mô hình này vẫn mở ra một số lượng lớn hơn các ngôn ngữ mới để dịch phổ biến.

Các nhà nghiên cứu sẽ cung cấp miễn phí mô hình, mã và dữ liệu điểm chuẩn của họ cho những người khác để xây dựng khả năng dịch thời gian thực AI của riêng họ. Nó hiện chỉ có thể dịch một câu tại một thời điểm, nhưng đó là một bước tiến tới dịch đồng thời.

Việc mở các tài nguyên này để dịch các ngôn ngữ bất thành văn cũng có thể có tác động sâu sắc đến việc đưa mọi người vào một thế giới ngày càng kỹ thuật số. Hầu hết các giao diện tương tác với máy tính và thiết bị đều yêu cầu văn bản và người nói ngôn ngữ không thành văn bị loại bỏ. Kết quả là, họ ít cảm thấy thoải mái hơn với công nghệ.

Một số ngôn ngữ không có hệ thống chữ viết được chuẩn hóa cũng có nguy cơ chết dần. Các nhà ngôn ngữ học đang cố gắng bảo tồn chúng khi số lượng người nói ngày càng giảm, nhưng điều đó thật khó khăn khi không có hệ thống chữ viết. Điều đó có thể trở thành một vấn đề thực sự với sự gia tăng ngày càng tăng của các công nghệ kỹ thuật số, để lại những người nói ngôn ngữ không thành văn.

Các kỹ sư của Meta AI hy vọng mô hình dịch thời gian thực bước đầu tiên này cho Hokkien có thể mở đường cho việc giúp những người nói các ngôn ngữ không thành văn khác trong tương lai nắm bắt được khoảng cách kỹ thuật số và nói thoải mái hơn qua các rào cản ngôn ngữ, đồng thời giúp các nhà ngôn ngữ học bảo tồn các ngôn ngữ không được viết.

“Tôi chỉ muốn cha tôi có thể nói chuyện với bất cứ ai mà ông ấy muốn,” Chen nói.

Ảnh: Pixabay

Hãy thể hiện sự ủng hộ của bạn đối với sứ mệnh của chúng tôi bằng cách tham gia Câu lạc bộ Cube và Cộng đồng sự kiện Cube gồm các chuyên gia. Tham gia cộng đồng bao gồm Amazon Web Services và Giám đốc điều hành Amazon.com Andy Jassy, ​​người sáng lập kiêm Giám đốc điều hành Dell Technologies, Michael Dell, Giám đốc điều hành Intel Pat Gelsinger và nhiều chuyên gia và nhân vật nổi tiếng khác.

bài viết tương tự

Leave a Reply