Giới khoa học Mỹ tìm ra cách chuyển suy nghĩ vào máy tạo giọng nói

26/04/2019 15:33 GMT+7

Một máy tính đặt mục tiêu chuyển đổi dòng suy nghĩ thành lời nói nghe có vẻ tự nhiên vừa được các nhà phát triển khen ngợi là bước đột phá quan trọng.

Theo CNBC, các nhà nghiên cứu tại Đại học California, San Francisco (Mỹ), thiết kế hệ thống để khôi phục lời nói cho những người bị liệt hoặc tổn thương thần kinh. Hệ thống này là mô phỏng máy tính biến tín hiệu não thành giọng nói. Các nhà khoa học vừa công bố bài nghiên cứu của mình trên tạp chí Nature giữa tuần này.
Thiết bị hoạt động bằng cách sử dụng giao diện não - máy tính (BCI) vốn giúp xử lý ý định lời nói của một người bằng cách kết hợp tín hiệu não với các chuyển động vật lý thường được kích hoạt trong nhóm cơ quan phát âm của người, gồm thanh quản, hàm, môi và lưỡi. Dữ liệu sau đó được dịch bởi một máy tính thành lời nói. Kỹ thuật tương tự từng được dùng để tạo chuyển động tay chân cho người bị liệt.
Các hệ thống BCI trước đây từng tạo điều kiện cho lời nói song tập trung vào việc gõ thông điệp. Chúng cho phép người ta gõ tối đa 10 từ mỗi phút, chậm hơn rất nhiều so với tốc độ nói trung bình là khoảng 150 từ mỗi phút.
Giới khoa học làm việc với năm tình nguyện viên có hoạt động não được theo dõi như là một phần của quá trình điều trị bệnh động kinh. Họ ghi lại hoạt động trong khu vực xuất phát ngôn ngữ của não khi các tình nguyện viên đọc to hàng trăm câu. Giới nghiên cứu làm việc trong dự án này khẳng định hệ thống máy tính không chỉ khôi phục được lời nói, mà còn có thể tái tạo giọng người như thật để truyền tải cả cảm xúc lẫn tính cách của người nói.
“Lần đầu tiên, nghiên cứu chứng minh rằng chúng ta có thể tạo ra toàn bộ câu nói dựa trên hoạt động não cá nhân của mình. Đây là bằng chứng tuyệt vời về nguyên tắc rằng công nghệ đã nằm trong tầm tay, chúng ta có thể chế tạo thiết bị có khả năng lâm sàng cho những bệnh nhân mất giọng nói”, Edward Chang, giáo sư phẫu thuật thần kinh kiêm tác giả chính của nghiên cứu, cho biết.
Gopala Anumanchipalli, nhà khoa học về lời nói kiêm người dẫn đầu nghiên cứu, cho hay bước đột phá đến từ việc liên kết hoạt động não với chuyển động trong miệng và cổ họng khi nói, thay vì liên kết tín hiệu não với thanh và âm. “Chúng tôi lý luận rằng nếu các trung tâm sản sinh lời nói trong não là các chuyển động mã hóa chứ không phải âm thanh, chúng ta nên cố gắng làm điều tương tự để giải mã các tín hiệu đó”, ông Anumanchipalli cho hay.
Đến 69% từ mà máy tính tạo ra được những người tham gia nghiên cứu xác nhận là chính xác. Giới nghiên cứu cho rằng đây là tỷ lệ tốt hơn đáng kể so với những gì đạt được trong nhiều nghiên cứu trước.
Top

Bạn không thể gửi bình luận liên tục. Xin hãy đợi
60 giây nữa.