Giới thiệu đề tài nhóm giải nhất SV NCKH trong lĩnh vực điện tử, đề tài: “Nghiên cứu, thiết kế trợ lý ảo cá nhân trên nền tảng web kết hợp học máy và xử lý ngôn ngữ tự nhiên”.
Nhóm sinh viên thực hiện đề tài gồm có Nguyễn Đức Nam Bình lớp 2018DHDTTT01-ĐH K13 chủ nhiệm đề tài các thành viên Lê Thanh Nga lớp 2018DHDTTT06-ĐH K13, Tăng Xuân Biên lớp 2018DHDTTT06-ĐH K13, Trần Minh Chiến lớp 2019CDCNTT01-ĐH K21, Trần Bá Hiến lớp 2018DHDTTT04-ĐH K13 dưới sự hướng dẫn khoa học của TS. Hà Thị Kim Duyên
Khoa học công nghệ ngày càng phát triển và có vai trò hết sức quan trọng không thể thiếu trong cuộc sống hiện đại. Con người ngày càng tạo ra những cỗ máy thông minh có khả năng tự nhận biết và xử lí được các công việc một cách tự động, phục vụ cho lợi ích của con người, khi đó mong muốn của con người tạo ra robot không chỉ để làm việc mà còn là một phần trong đời sống tinh thần của con người - là một người bạn đồng hành của con người, có thể tương tác giữa con người qua giọng nói, thị giác, cử chỉ. Để tương tác giữa người với robot một cách hiệu quả nhất, con người đã đặt ra các yêu cầu về tương tác giữa người với robot, người ta hy vọng rằng robot có thể hiểu được ngôn ngữ giọng nói của con người và thực hiện trao đổi với con người qua ngôn ngữ giọng nói. Vì vậy để góp phần tìm hiểu thêm về tương tác giữa robot với con người qua ngôn ngữ nên nhóm nghiên cứu đã đề xuất đề tài: “Nghiên cứu, thiết kế trợ lý ảo cá nhân trên nền tảng web kết hợp học máy (Machine Learning) và xử lý ngôn ngữ tự nhiên (Natural Language Processing)”. Đề tài thực hiện thiết kết một chatbot tích hợp thêm các dịch vụ Automatic Speech Recognition (ASR) và Text to Speed (TTS) để cung cấp tương tác bằng giọng nói cho chatbot trên nền tảng web.
Đề tài làm tiền để thực hiện ứng dụng, phát triển trên robot thông minh, giúp robot có thể thực hiện tương tác với con người qua ngôn ngữ giọng nói.
Sau khoảng thời gian làm đề tài dưới sự hướng dẫn tận tình của TS. Hà Thị Kim Duyên và cơ sở vật chất thiết bị được TS. Ngô Mạnh Tiến cung cấp, nhóm nghiên cứu đã hoàn thành được đề tài nghiên cứu của mình và có thể thực hiện ứng dụng, phát triển chatbot trên robot lễ tân IVASTBot. Đề tài được thực hiện là hệ thống ứng dụng trí tuệ nhân tạo xây dựng một hệ thống chatbot với khả năng “trò chuyện” với con người thông qua ngôn ngữ văn bản, giọng nói. Kiến trúc Task-oriented Dialogue Systems(TODs) được sử dụng để xây dựng Chatbot và phát triển trên nền tảng mã nguồn mở Rasa framework, bên cạnh đó hệ thống Chatbot còn thực hiện tích hợp thêm các dịch vụ Automatic Speech Recognition (ASR) và Text to Speed (TTS) để cung cấp tương tác bằng giọng nói cho IVASTChatbot. Ứng dụng chatbot trên Robot thông minh, mong muốn Robot có khả năng nhận biết thông tin người dùng cung cấp qua ngôn ngữ văn bản, giọng nói; thực hiện xử lý và “trò chuyện” với con người qua văn bản, giọng nói.
Trong quá trình thực hiện nghiên cứu nhóm nghiên cứu đã đạt được một số kết quả sau đây:
- Cài đặt môi trường, sử dụng linh hoạt các thư viện cần thiết và ngôn ngữ lập trình Python.
- Tiếp cận các kiến thức về trí tuệ nhân tạo, máy học và học sâu, xử lý ngôn ngữ tự nhiên. Tìm hiểu ứng dụng trí tuệ nhân tạo thực hiện thiết kế một hệ thống chatbot cơ bản. Các ứng dụng của hệ thống chatbot trong đời sống.
- Tìm hiểu về mạng nơron nhân tạo và ứng dụng vào xử lý ngôn ngữ tự nhiên, xây dựng chatbot.
- Thực hiện tìm hiểu, ứng dụng hệ thống trên robot dạng người thông minh.
Hệ thống được thiết kế với 3 tính năng: một là khả năng của robot nhận dạng ra ngôn ngữ giọng nói của con người, hai là khả năng robot có thể xử lý và đưa ra kết quả, ba là robot có thể thực hiện giao tiếp truyền đạt ngôn ngữ giọng nói.
Hình 1: Kiến trúc mô hình tổng quan các thành phần xử lý trong Chatbot
Bên cạnh đó hệ thống Chatbot còn thực hiện tích hợp thêm các dịch vụ Automatic Speech Recognition (ASR) và Text to Speed (TTS) để cung cấp tương tác bằng giọng nói cho IVASTChatbot.
Mỗi thành phần trong Chatbot đều có vài trò riêng biệt
NLU: Chịu trách nhiệm chuyển đổi tin nhắn văn bản của người dùng thành dạng dữ liệu có cấu trúc đã được định nghĩa từ trước. Dạng dữ liệu có cấu trúc này chính là các Intents, Entities.
DST: Chịu trách nhiệm theo dõi và cập nhật trạng thái của cuộc hội thoại. Có 2 luồng xử lý riêng biệt trong module này bao gồm: luồng 1 cấp nhật trạng thái được kích hoạt bởi module NLU, luồng 2 cập nhật trạng thái kích hoạt bởi Dialogue Policy.
DB: Thực hiện dự đoán hành động kế tiếp mà Chatbot cần thực hiện dựa trên trạng thái cuộc hội thoại được gửi tới từ DST.
NLG: Chịu trách nhiệm tạo ra câu trả lời bằng ngôn ngữ tự nhiên từ kết quả của module DP. Phương pháp truyền thống là sử dụng một bộ các mẫu câu có sẵn kết hợp với kết quả từ DP để tạo ra câu trả lời.
Chương trình thử nghiệm được thiết kế, xây dựng và thực hiện trên môi trường hệ điều hành Windows với nền tảng framework Rasa, dựa trên ngôn ngữ lập trình python. Giao diện người dùng sử dụng nền tảng web/ứng dựng chat.
Thiết kế giao diện người dùng tương tác
Hình 2: Kiến trúc chung của hệ thống
Front-end sử dụng giao diện web hoặc các trình nhắn tin phổ biến. Với mục tiêu minh họa, ở đây nhóm nghiên cứu sử dụng giao diện web messenger.
Kiểm thử trên giao diện người dùng
Thực hiện thủ nghiệm tương tác với chatbot qua một số câu hỏi gần với kịch bản đã đào tạo cho chatbot
Hình 3: Ví dụ về đặt lịch hẹn
Hình 4: Ứng dụng chatbot trên robot thông minh
Kết quả của đề tài có thể được sử dụng, tiếp tục phát triển để có thể triển khai trên robot. Để làm cho robot có thể giao tiếp, tương tác với con người qua văn bản hoặc ngôn ngữ giọng nói.
Hình 5: Bạn Tăng Xuân Biên (thứ 2 từ trái sang), đại diện nhóm nghiên cứu nhận Giấy khen tại Hội nghị Tổng kết và trao giải Sinh viên Nghiên cứu khoa học lần thứ XIII
Tóm tắt kết quả nghiên cứu : Tải về tại đây
Thứ Hai, 08:27 25/07/2022
Copyright © 2018 Hanoi University of Industry.