Đội ngũ VNPT đã phát triển và làm chủ hơn 40 mô hình AI xử lý ảnh.
Đội ngũ VNPT đã phát triển và làm chủ hơn 40 mô hình AI xử lý ảnh.

Nhóm kỹ sư trẻ Việt Nam hai năm liên tiếp đứng đầu sân chơi AI toàn cầu

Nhóm kỹ sư trí tuệ nhân tạo (AI) của VNPT tiếp tục giữ vững vị trí dẫn đầu tại AI City Challenge 2025, cuộc thi quốc tế uy tín về AI xử lý ảnh, đánh dấu năm thứ hai liên tiếp Việt Nam có đại diện đạt giải cao nhất.

Mới đây, lễ công bố kết quả AI City Challenge 2025 (AI trong thành phố thông minh) đã diễn ra trong khuôn khổ hội nghị quốc tế về Thị giác máy tính (ICCV 2025) tại Hawaii (Mỹ). Nối tiếp chiến thắng năm 2024, đội ngũ kỹ sư AI của Tập đoàn Bưu chính-Viễn thông Việt Nam (VNPT) năm nay giành vị trí quán quân ở hạng mục “Xử lý và nhận diện vật thể từ dữ liệu hình ảnh camera góc siêu rộng tại thiết bị biên (Edge AI)”.

Bài toán yêu cầu hệ thống AI có tốc độ xử lý thời gian thực, trực tiếp trên thiết bị phần cứng nhỏ gọn, đồng thời bảo đảm độ chính xác cao trong nhận diện vật thể từ dữ liệu hình ảnh có độ biến dạng lớn, đáp ứng các nhu cầu thực tế.

AI City Challenge 2025 là một trong những cuộc thi thường niên uy tín nhất thế giới về AI ứng dụng trong đô thị thông minh. Cuộc thi năm nay gồm bốn hạng mục với độ phức tạp cao hơn các mùa trước, thu hút hơn 30.000 đội thi tới từ các quốc gia phát triển mạnh về AI như Mỹ, Trung Quốc, Hàn Quốc...

vnpt-1.png
Đội ngũ kỹ sư của VNPT dẫn đầu nhờ độ chính xác và tốc độ xử lý của AI tại biên.

Thách thức nâng cao năng lực AI tại biên

Bài toán xử lý và nhận diện vật thể từ dữ liệu hình ảnh camera góc siêu rộng được đưa vào AI City Challenge từ năm 2024, phản ánh xu hướng ứng dụng thị giác máy tính vào các hệ thống giám sát giao thông hiện nay. Với tính thực tiễn cao, hạng mục luôn là đường đua có số lượng đội thi đông nhất toàn cuộc.

Năm nay, độ khó của hạng mục được nâng cao khi ngoài việc xử lý chính xác hình ảnh bị méo, biến dạng, các đội phải tối ưu toàn bộ quy trình để mô hình có thể vận hành hiệu quả trên thiết bị biên.

vnpt1.png
Nhóm kỹ sư VNPT áp dụng nhiều kỹ thuật để nhận diện nhanh và chính xác các phương tiện.

Các đội thi được yêu cầu phải tối ưu mô hình để vận hành hiệu quả trên thiết bị Jetson Orin, một thiết bị nhỏ gọn đặt ngay tại điểm thu thập dữ liệu (gọi là thiết bị biên), có giới hạn công suất 30W và năng lực tính toán thấp hơn nhiều so với máy chủ trung tâm. Điều này đồng nghĩa với việc các đội thi không thể sử dụng các mô hình quá lớn, mà phải tinh giản và tối ưu để chương trình chạy nhanh, tiêu tốn ít tài nguyên hơn nhưng vẫn nhận dạng phương tiện chính xác.

Những thay đổi này khiến AI City Challenge 2025 trở thành một trong những mùa thi khó nhất từ trước đến nay, nhất là khi các đội đã học hỏi từ kinh nghiệm năm trước và mức độ cạnh tranh tăng rõ rệt.

Lợi thế từ kinh nghiệm tối ưu mô hình thực tế

Trong các bài toán giám sát giao thông, hạ tầng tính toán và kết nối mạng thường bị giới hạn, khiến việc phát triển mô hình AI vừa chính xác, vừa vận hành hiệu quả trở thành thách thức lớn. Đây cũng là lý do AI tại biên (Edge AI) trở thành xu hướng tất yếu. Thay vì gửi toàn bộ dữ liệu lên máy chủ trung tâm để xử lý, mô hình được đặt ngay tại thiết bị thu thập (như camera), giúp phản hồi nhanh hơn, giảm độ trễ, tiết kiệm băng thông và bảo đảm an toàn dữ liệu, đặc biệt là trong các hệ thống giám sát quy mô lớn.

Theo kết quả công bố tại AI City Challenge 2025, nhóm kỹ sư VNPT đứng đầu, vượt qua hàng trăm đội đến từ các tập đoàn công nghệ, viện nghiên cứu và trường đại học lớn trên thế giới. Thành tích này góp phần củng cố hệ sinh thái AI giám sát giao thông và an ninh đô thị trong nước, nơi các camera góc siêu rộng đang được triển khai rộng rãi để mở rộng vùng quan sát, giảm điểm mù, giảm số lượng thiết bị lắp đặt và nâng cao hiệu quả vận hành hạ tầng đô thị.

Với hơn bảy năm kinh nghiệm phát triển các mô hình AI xử lý hình ảnh và triển khai trong nước, đội ngũ kỹ sư VNPT đã tích lũy năng lực cân bằng giữa độ chính xác, tốc độ và chi phí vận hành - những yếu tố quyết định hiệu quả khi đưa AI vào môi trường thực.

Hiện đội ngũ VNPT đã phát triển và làm chủ hơn 40 mô hình AI xử lý ảnh khác nhau như nhận diện biển số xe, đo đếm lưu lượng giao thông, phát hiện người đội mũ bảo hiểm, cũng như các mô hình đặc thù cho Việt Nam như phát hiện xe chở ba người, chở hàng cồng kềnh, hay phát hiện cháy, vũ khí trong lĩnh vực an ninh và giám sát đô thị. Các mô hình này được tối ưu hóa để hoạt động trên nhiều loại phần cứng, từ GPU, CPU đến NPU, đáp ứng yêu cầu đa dạng của các hệ thống và khách hàng.

Để có thể triển khai hiệu quả trên quy mô lớn, đặc biệt trong mô hình on-premise (triển khai tại chỗ) và triển khai tại biên với hàng trăm camera đồng thời, các kỹ sư VNPT cũng đã xây dựng các phương pháp xử lý tối ưu cho phép vận hành đồng thời hàng trăm luồng dữ liệu video. Cách tiếp cận này giúp các giải pháp AI dễ dàng mở rộng, tiết kiệm tài nguyên và phù hợp với điều kiện hạ tầng tại nhiều địa phương.

Triển khai kinh nghiệm đó vào AI City Challenge 2025, nhóm đã áp dụng tổng hợp các kỹ thuật như nén mô hình để giảm dung lượng và tài nguyên xử lý, tối ưu luồng xử lý ảnh nhằm giảm độ trễ, và tinh chỉnh ngôn ngữ lập trình cùng cấu trúc mã nguồn để hình thành chuỗi xử lý tổng thể đạt hiệu năng cao nhất. Cách tiếp cận này giúp mô hình duy trì độ chính xác trong khi tăng tốc độ suy luận và khả năng triển khai trên các thiết bị biên có cấu hình giới hạn.

Nền tảng nghiên cứu AI chuyên sâu đa lĩnh vực

Không chỉ sở hữu đội ngũ nhân sự trẻ tài năng, hạ tầng tính toán mạnh, một trong những tiền đề quan trọng để VNPT có hệ sinh thái sản phẩm AI toàn diện, đạt các tiêu chuẩn quốc tế, giành giải cao tại các cuộc thi uy tín đó là nền tảng nghiên cứu AI chuyên sâu trong đa lĩnh vực.

Đối với ứng dụng AI trong xử lý ảnh, bên cạnh các hệ thống giao thông và đô thị thông minh, VNPT còn đẩy mạnh nghiên cứu ứng dụng vào lĩnh vực y tế.

Tháng 9/2025, tập đoàn này công bố nghiên cứu khoa học tại MICCAI 2025 - hội nghị hàng đầu thế giới về AI và thị giác máy tính trong y học. Nghiên cứu tập trung vào ứng dụng AI trong chẩn đoán ung thư tuyến giáp, được thực hiện với dữ liệu từ gần 10.000 người bệnh tại 3 miền đất nước trong suốt 4 năm. Dự án đóng vai trò nền tảng cho việc phát triển các hệ thống hỗ trợ chẩn đoán tự động phù hợp với đặc thù dân số và điều kiện y tế trong nước, giúp nâng cao độ chính xác, rút ngắn thời gian chẩn đoán, giảm tải cho bác sĩ, đồng thời mở rộng khả năng tiếp cận dịch vụ y tế chất lượng cao đến các tuyến cơ sở.

ngadd.jpg
Đội ngũ kỹ sư AI của VNPT công bố nghiên cứu tại nhiều hội nghị khoa học uy tín.

Trong lĩnh vực xử lý ngôn ngữ và giọng nói, VNPT cũng công bố các nghiên cứu tại EMNLP 2025 - hội nghị AI hạng A* về xử lý ngôn ngữ tự nhiên, và ICASSP 2025 - hội nghị xếp hạng A1 về xử lý tiếng nói.

Các công trình này ứng dụng những kỹ thuật học máy tiên tiến trong phát triển mô hình ngôn ngữ lớn (LLM) và AI tạo sinh (Generative AI), nhằm nâng cao khả năng hiểu ngữ cảnh, cảm xúc và sắc thái tiếng Việt của các mô hình AI – vốn là những yếu tố phức tạp và ít được mô hình hóa trong các bộ ngữ liệu quốc tế. Nhờ đó, ngôn ngữ Việt ngày càng hiện diện rõ nét hơn trong cộng đồng nghiên cứu NLP toàn cầu, mở ra khả năng xây dựng mô hình ngôn ngữ mạnh, giàu bản sắc và phù hợp với người Việt.

Xem thêm