KỸ THUẬT PHÂN LỚP SUPPORT VECTOR MACHINES TRONG NHẬN DẠNG TIẾNG NÓI
Tác giả: Hồ Thị Huyền Thương
Tạp chí công dân & khuyến học
Quyển: 3 Trang: 54-55
Năm xuất bản: 3/2024
Tóm tắt
Support Vector Machines (SVM) là một thuật toán học máy hiệu quả được ứng dụng rộng rãi trong nhận dạng tiếng nói. SVM hoạt động bằng cách tìm ra đường phân chia tốt nhất (siêu phẳng) để tách biệt các nhóm âm thanh khác nhau. Ưu điểm của SVM là khả năng xử lý dữ liệu phi tuyến tính, độ chính xác cao và khả năng tổng quát hóa tốt. Quy trình sử dụng SVM bao gồm trích xuất đặc trưng từ tín hiệu âm thanh, xây dựng mô hình SVM, huấn luyện và đánh giá mô hình. SVM được ứng dụng trong nhiều lĩnh vực như nhận dạng giọng nói, hệ thống điều khiển bằng giọng nói và trợ lý ảo. Tuy nhiên, hiệu suất của SVM phụ thuộc vào chất lượng dữ liệu, lựa chọn đặc trưng và các tham số của mô hình.
Từ khóa
Kỹ thuật trích chọn, MFCC, nhận dạng tiếng nói