[Infographic] Trí tuệ nhân tạo Việt vào top 12 thế giới về nhận dạng văn bản

Mô hình CATI-VLM được xếp hạng Top 12 thế giới và Top 1 Việt Nam tại Cuộc thi quốc tế Robust Reading Competition (RRC), hạng mục Document Visual Question Answering (DocVQA), tổ chức tháng 6/2025.

Trong bối cảnh chuyển đổi số và chuyển đổi ứng dụng trí tuệ nhân tạo tại Việt Nam đang diễn ra mạnh mẽ, công nghệ OCR (Nhận dạng ký tự quang học) ngày càng giữ vai trò quan trọng trong việc số hóa tài liệu, tự động hóa quy trình nghiệp vụ, tiết kiệm chi phí và nâng cao hiệu quả quản trị.

Tuy nhiên, với đặc thù tiếng Việt có dấu và chữ viết tay, bài toán nhận dạng không chỉ dừng lại ở việc 'đọc chữ', mà đòi hỏi mô hình phải có khả năng hiểu ngữ cảnh toàn diện.

Trước thách thức đó, Viện Ứng dụng Công nghệ CMC (CMC ATI) đã phát triển mô hình CATI-VLM - một hệ thống hiểu tài liệu bằng thị giác máy tính (Visual Document Understanding).

Dựa trên kho dữ liệu lớn tới 5TB, mô hình này vừa được xếp hạng Top 12 thế giới và Top 1 Việt Nam tại cuộc thi quốc tế Robust Reading Competition (RRC), hạng mục Document Visual Question Answering (DocVQA), tổ chức tháng 6/2025.

Xem thêm