Search Dental Tribune

Nghiên cứu nêu bật tiềm năng và rủi ro của các công cụ AI trong việc lưu trữ hồ sơ nha khoa

Một nhóm nhà nghiên cứu tại Vương quốc Anh kêu gọi các đội ngũ nha khoa thận trọng khi sử dụng các công cụ AI chuyển giọng nói thành văn bản để hoàn thiện hồ sơ bệnh án. (Hình: DC Studio/Adobe Stock)
Dental Tribune International

Dental Tribune International

T5. 20 Tháng 11 2025

Lưu lại

LONDON, Anh: Một trong những kỳ vọng quan trọng của các công cụ dựa trên trí tuệ nhân tạo (AI) trong nha khoa là giúp rút ngắn thời gian thực hiện các tác vụ tốn nhiều công sức. Việc soạn thảo hồ sơ sức khỏe điện tử là một lĩnh vực mà AI có thể mang lại tiết kiệm thời gian đáng kể; tuy nhiên, các bác sĩ lâm sàng cần có khả năng tin tưởng vào tài liệu nhất quán và không có sai sót. Theo một nhóm nhà nghiên cứu đã kiểm tra độ chính xác của nhiều hệ thống nhận dạng giọng nói tự động (ASR) dựa trên AI, các hệ thống hiện tại vẫn cần sự giám sát của chuyên môn lâm sàng.

Nhằm đánh giá độ chính xác về từ vựng, phiên âm và ngữ nghĩa của các công cụ ASR trong môi trường lâm sàng, các nhà nghiên cứu đã đọc 200 hồ sơ lâm sàng chỉnh nha chứa nhiều thuật ngữ kỹ thuật và từ vựng chuyên ngành nha khoa, sau đó sử dụng các bản ghi âm này để kiểm tra mười hệ thống ASR. Bốn hệ thống trong số đó là sản phẩm thương mại: Heidi, DigitalTCO, Dragon Medical One và Dragon Professional Anywhere. Năm hệ thống khác là giao diện lập trình ứng dụng (API) kết nối các phần mềm khác nhau: Amazon, Google, Speechmatics, Whisper và GPT-4o Transcribe. Cuối cùng, một hệ thống kết hợp giao diện GPT-4o Transcribe với mô hình GPT-4o để sửa lỗi, gọi là GPT4oTranscribeCorrected.

Các nhà nghiên cứu phát hiện rằng lỗi định dạng và lỗi ngữ pháp nhỏ xuất hiện phổ biến trong bản chép của tất cả các hệ thống, và lỗi Class 3—những lỗi làm thay đổi ý nghĩa và có thể ảnh hưởng tiêu cực đến chăm sóc lâm sàng—cũng xuất hiện ở mọi hệ thống. Lỗi Class 3 chiếm từ 0,21% đến 4,15% tổng số lỗi mà các hệ thống tạo ra. GPT4oTranscribeCorrected tạo ra ít lỗi Class 3 nhất (2% bản chép có ít nhất một lỗi), trong khi Dragon Medical One tạo ra nhiều nhất (66% bản chép có ít nhất một lỗi).

Ngoài ra, các hệ thống gặp khó khăn với nhiều thuật ngữ chuyên ngành nha khoa. Ví dụ, từ “Essix” bị phiên âm sai tới 97,5% trường hợp. Các thuật ngữ như “palatally”, “mesially” và “buccally” cũng bị diễn giải sai trong phần lớn các trường hợp. Nhóm nghiên cứu nhận thấy giọng nói của người đọc chỉ ảnh hưởng nhỏ đến lỗi và tiếng ồn nền khiến hiệu suất của tất cả các hệ thống giảm.

Khi bàn luận về kết quả, các nhà nghiên cứu nhấn mạnh tiềm năng của hệ thống ASR trong việc tối ưu hóa ghi chép lâm sàng và chỉ ra những cải tiến có thể áp dụng, chẳng hạn như sử dụng chỉ báo độ tin cậy để đánh dấu các thuật ngữ có khả năng sai. Tuy nhiên, họ nhấn mạnh rằng “biện pháp bảo vệ quan trọng nhất là duy trì quy trình ‘con người trong vòng lặp’ để xác minh bản chép, khi bác sĩ chuyển vai trò từ người viết sang người biên tập ghi chú của mình”.

Tác giả chính, TS Ruairi O’Kane, nhà nghiên cứu tại Trung tâm Sinh học Sọ mặt và Tái tạo của King’s College London, cho biết trong thông cáo báo chí của trường: “Các công cụ AI hỗ trợ ghi âm có thể giúp hợp lý hóa quy trình tài liệu và cải thiện hiệu quả, nhưng chúng ta phải luôn cảnh giác. Chỉ một lỗi phiên âm nhỏ cũng có thể ảnh hưởng đến chăm sóc bệnh nhân.”

Nghiên cứu có tựa đề “Độ chính xác phiên âm của hệ thống nhận dạng giọng nói tự động trong hồ sơ lâm sàng chỉnh nha” được công bố trực tuyến ngày 3 tháng 11 năm 2025 trên Journal of Dental Research, trước khi được đưa vào số báo in.

Chủ đề:
Thẻ:
To post a reply please login or register
advertisement