Sinh viên Việt Nam dùng Trí tuệ Nhân tạo để đọc văn bản cổ Nhật Bản, tương lai cho chữ Nôm

28-02-2018

NIENLICH - Lý và Nguyễn vừa học ở trường Đại học Khoa học và Công nghệ Hà Nội. Nguyễn cũng tham gia vào việc sử dụng AI để giải mã các bài viết trên các phiến gỗ dài, mỏng bằng gỗ được tìm thấy từ di tích Heijo Palace cổ ở Nara.

 

Giáo sư Masaki Nakagawa của Đại học Nông nghiệp và Công nghệ Tokyo cùng với hai sinh viên Việt Nam Tuan Nam Ly (giữa) và Kha Công Nguyen tại trường Koganei, Tokyo vào ngày 11/01/2018. (Mainichi)

 

Hai sinh viên Việt Nam tại Học viện kỹ thuật Công nghệ Nông nghiệp và Công nghệ Tokyo đã giành được một giải thưởng cuộc thi gần đây trong việc phát triển một hệ thống trí tuệ nhân tạo (AI) để đọc các văn bản cổ của Nhật Bản.

Hai mươi ba đội từ các trường đại học và các trường cao đẳng kỹ thuật trên khắp Nhật Bản đã tham gia cuộc thi tháng 12 năm 2017 do Viện Điện tử, Thông tin và Truyền thông (IEICE) hỗ trợ. Thử thách của cuộc thi là: tạo ra AI có hiệu quả nhất trong việc đọc chữ viết cổ hiragana, một trong hai ngữ âm của tiếng Nhật.

AI được thiết kế bởi Tuan Nam Ly (Lý) và Kha Cong Nguyen (Nguyễn) thuộc Đại học Nông nghiệp và Công nghệ Tokyo. Cả hai đều đã tìm thấy 96% các chữ đơn và 88% bộ ba ký tự. Cả hai đang học tập dưới sự hướng dẫn của giáo sư Masaki Nakagawa tại trường học ở ngoại ô phía tây Tokyo của Koganei.

Cặp đôi này đã dành bốn tháng để phát triển hệ thống, một mạng lưới thần kinh ba lớp mô phỏng chức năng não của con người. AI này đã được đặt cho nhiệm vụ học 300.000 ký tự hiragana bằng hình ảnh từ 14 bản viết tay, bao gồm 'Cuộc đời của một người đàn ông đáng yêu' của tác giả Ihara Saikaku của thời Edo.

“Chúng tôi đã chạy thử nghiệm nhiều lần để nâng cao độ chính xác của AI. Điều đó thực sự thú vị,” Tuan Nam Ly cho biết.

Hai ví dụ về ký tự hiragana viết tay cổ, có thể khó khăn ngay cả đối với người để đọc. (Hình ảnh được cung cấp bởi Viện Văn học Nhật Bản)

 

Lý và Nguyễn vừa học ở trường Đại học Khoa học và Công nghệ Hà Nội. Nguyễn cũng tham gia vào việc sử dụng AI để giải mã các bài viết trên các phiến gỗ dài, mỏng bằng gỗ được tìm thấy từ di tích Heijo Palace cổ ở Nara. Nguyễn nói mục tiêu cá nhân của anh là xây dựng hệ thống AI có thể đọc Chữ Nôm, một hệ thống chữ viết Việt Nam độc đáo được phát triển từ thế kỷ thứ 10 trở đi. Hiện nay có rất ít người có thể đọc được chữ này, vì vậy có rất nhiều bản văn cổ vẫn không dịch sang tiếng Việt hiện đại.

'Tôi muốn làm cho những văn bản này có thể sử dụng được cho đất nước', anh Nguyễn nói.

Giáo sư Nakagawa cho biết nghiên cứu của sinh viên Việt Nam 'chắc chắn sẽ hữu ích trong nghiên cứu lịch sử'. Phòng thí nghiệm của Nakagawa còn tham gia vào việc phát triển các hệ thống để đọc các câu trả lời kiểm tra viết tay, bao gồm cả các kỳ thi tuyển sinh.


Benjamin Kang - Nienlich.vn


 

Content1 (mobil)
content1nhasangnghiep
Content2 (mobil)
content2