Ra mắt nền tảng chuyển giọng nói thành văn bản và giọng nói nhân tạo

Chiều 19/6, tại Hà Nội, Bộ Thông tin và Truyền thông (TT&TT) đã tổ chức lễ ra mắt nền tảng chuyển giọng nói tiếng Việt thành văn bản VAIS và nền tảng giọng nói nhân tạo tiếng Việt tự nhiên Vbee.

Đây là một trong chuỗi sự kiện giới thiệu các nền tảng số “Make in Vietnam” nhằm thực hiện “Chương trình chuyển đổi số quốc gia đến năm 2025, định hướng đến năm 2030” vừa được Thủ tướng Chính phủ phê duyệt.
Về hai nền tảng số mới được Bộ TT&TT giới thiệu lựa chọn giới thiệu và bảo trợ về truyền thông, Thứ trưởng Nguyễn Thành Hưng nhận định, nền tảng chuyển giọng nói tiếng Việt thành văn bản VAIS và nền tảng giọng nói nhân tạo tiếng Việt tự nhiên Vbee là 2 nền tảng số “Make in Vietnam” tiên phong về công nghệ lõi “Speech - to - Text” và “Text - to - Speech” sử dụng trí tuệ nhân tạo để chuyển đổi giữa giọng nói và văn bản tiếng Việt.
Ra mat nen tang chuyen giong noi thanh van ban va giong noi nhan tao
 Quang cảnh buổi giới thiệu nền tảng công nghệ xử lý giọng nói tiếng Việt và Vbee.
Theo giới thiệu của đại diện nhóm phát triển Vbee, với hơn 10 năm nghiên cứu và phát triển chuyên sâu, nền tảng công nghệ Vbee có những đặc trưng cơ bản như: Có thể học theo bất kỳ giọng của một người nào đó trong vòng 4 giờ đồng hồ với độ tương tự trên 95%; giọng nói Vbee đa dạng vùng miền (Bắc, Trung, Nam...), giới tính và độ tuổi (nam, nữ). Công nghệ giọng nói nhân tạo Vbee còn có thể dự đoán cách đọc, các từ viết tắt, từ vay mượn, các từ ngữ đặc trưng của tiếng Việt mà các giải pháp nước ngoài không thể.
Có thể kể đến những đóng góp của Vbee cho các giải pháp trong lĩnh vực sử dụng giọng nói nhân tạo như: Giải pháp về nội dung nhân tạo (sách nói, báo nói, lồng tiếng phim tự động, thu âm tự động…), giải pháp về tổng đài nhân tạo (vận tải, tài chính, thương mại điện tử…), giải pháp nhà thông minh (giao tiếp với thiết bị qua ngôn ngữ), giải pháp chatbot chăm sóc, tư vấn khách hàng.
Đối với VAIS, nền tảng công nghệ chuyển giọng nói tiếng Việt thành văn bản này có những đặc trưng như: Nhận dạng được đầy đủ giọng nói cả 3 miền Bắc, Trung, Nam với độ chính xác lên đến 95%; chuyển đổi giọng nói tiếng Việt thành văn bản với kết quả tức thì, với tốc độ vượt trội có thể nhanh gấp 500 lần thời lượng âm thanh.
VAIS cũng hỗ trợ nhận dạng tốt trong môi trường nhiễu và ở khoảng cách xa. Đặc biệt, nền tảng này có tính năng chuẩn hóa văn bản đầu ra: tên riêng, ngày, tháng, số…, hỗ trợ nhiều loại định dạng âm thanh đầu vào; cung cấp giải pháp cho người dùng trực tiếp hoặc kết nối thông qua API tại https://vais.vn.
Trên thực tế, nền tảng VAIS hiện đã được nhiều cơ quan nhà nước ở Trung ương và địa phương sử dụng như Văn phòng Trung ương Đảng, Văn phòng Chính phủ, Văn phòng Quốc hội, Bộ TT&TT, UBND thành phố Hà Nội cùng hơn 50 đơn vị báo chí, truyền hình để phục vụ gỡ băng bài phát biểu tại các kỳ họp, sự kiện. Nền tảng Vbee đã cung cấp dịch vụ cho hơn 20.000 khách hàng cá nhân, hơn 500 doanh nghiệp, tổng công ty, sử dụng rộng rãi trong 3 lĩnh vực chính bao gồm Tổng đài tự động, giải pháp tương tác thiết bị thông minh, nội dung số tự động.
Thứ trưởng Nguyễn Thành Hưng tin tưởng rằng VAIS và Vbee đang đứng trước một thị trường rộng lớn với hơn 96 triệu dân, 700 nghìn doanh nghiệp, 126 triệu thuê bao điện thoại di động, tỷ lệ người sử dụng Internet đạt 68,7% (số liệu thống kê năm 2019). Ngoài ra, nền tảng chuyển đổi tiếng nói tiếng Việt thành văn bản VAIS cũng có tiềm năng lớn với khối cơ quan Nhà nước với 22 Bộ, cơ quan ngang bộ, 8 cơ quan thuộc Chính phủ, 63 tỉnh, thành phố trực thuộc Trung ương bao gồm toàn bộ các cơ quan hành chính, đơn vị sự nghiệp các cấp.
Đặc biệt, công nghệ giọng nói tiếng Việt có thể được ứng dụng vào các sản phẩm và dịch vụ, cung cấp cho cộng đồng người khiếm thị và người bị câm, giúp người khuyết tật dễ dàng tiếp cận thông tin và sản xuất thông tin, mang lại ý nghĩa xã hội to lớn.
Còn theo ông Nguyễn Huy Dũng, Cục trưởng Cục Tin học hóa (Bộ TT&TT), trong thời gian qua, Bộ TT&TT đã ra mắt 10 nền tảng khác nhau. Có những nền tảng được thị trường chấp nhận và hết sức phổ biến, có những nền tảng khác còn hết sức mới.
“Theo phản hồi của thị trường, chất lượng của các nền tảng Việt không thua kém của nước ngoài, thậm chí tại một số lĩnh vực ngách, chất lượng của các nền tảng Việt còn tốt hơn của nước ngoài, chẳng hạn như nhận dạng, xử lý giọng nói tiếng Việt đạt độ chính xác tốt hơn, hay nền tảng học trực tuyến của Việt Nam đáp ứng linh hoạt hơn các nền tảng nước ngoài, có thể kết hợp học với thi và quản lý giáo dục. …”, ông Nguyễn Huy Dũng nhận định.
Theo XC/Báo Tin tức

>> xem thêm

Bình luận(0)