Quay lại

VnExpress Marathon dùng AI nhận diện số bib

Kích cỡ chữ:A+ |A |A-

Ngày đăng : 07/08/2020, 08:21 AM | Lượt xem : 12691

Giải chạy tại Quy Nhơn do VnExpress tổ chức cuối tuần qua sử dụng AI giúp vận động viên lọc được toàn bộ ảnh của mình nhanh chóng.

Để tìm kiếm ảnh, người dùng lên trang web của giải, gõ số bib và nhận về toàn bộ bức hình có mình, thay vì phải lướt toàn bộ kho ảnh với hàng chục nghìn tấm.

Quy trình này từng được áp dụng tại một số giải chạy quy mô lớn thời gian qua. Tuy nhiên tại VnExpress Marathon Quy Nhơn 2020, giải pháp công nghệ được các chuyên gia xây dựng theo cách riêng: ứng dụng AI để tìm và phân loại từng người trong một bức ảnh với thời gian xử lý tính bằng giây.

Tấm bib (màu xanh lục) trên trang phục của các vận động viên tại giải chạy tại Quy Nhơn năm 2020.

Số báo danh của vận động viên được in trên một tấm biển mềm, dán trên áo - gọi là bib. Việc quét một tấm biển và đọc số không khó với công nghệ ngày nay. Tuy nhiên, đây lại là bài toán phức tạp với tấm bib trên người của vận động viên chạy bộ.

Bib sẽ xuất hiện muôn hình muôn vẻ trên các tấm hình chụp trong giải chạy. Yêu cầu đưa ra cho đội kỹ thuật của VnExpress Marathon là phải đọc toàn bộ số bib trong một tấm ảnh với độ chính xác trên 90%, bất kể số nghiêng, méo hay bị che khuất một phần. Thời gian xử lý cho mỗi tấm ảnh từ 5 đến 10 giây, đồng thời hệ thống phải đảm bảo hoạt động ổn định, có thể nâng cấp dễ dàng nếu số lượng ảnh tăng đột biến.

"Ngay khi nhận được yêu cầu, chúng tôi đã tính đến giải pháp sử dụng AI để có thể đáp ứng triệt để các công việc trên", ông Nguyễn Lộc Vũ, Giám đốc công nghệ của VnExpress, chia sẻ.

Theo ông Vũ, chỉ riêng việc nhận diện số bib trong một tấm ảnh đã có ít nhất ba bài toán cần giải quyết: tìm đúng vị trí tấm bib, chuyển đổi hình ảnh thành chuỗi ký tự và đọc ra số báo danh trong chuỗi ký tự đó.

Để giải các bài toán này, đội ngũ kỹ thuật đã tạo ra hệ thống xử lý bằng AI, có khả năng nhận diện và khoanh vùng vận động viên trong ảnh. Tấm bib sẽ nằm trong các vùng có vận động viên với xác suất gần như 100%. Việc này giúp máy không phải xử lý dữ liệu thừa, chẳng hạn biển quảng cáo, bảng đồng hồ, biển số xe... xuất hiện trên đường chạy. Đây cũng là điểm khác biệt của hệ thống do VnExpress phát triển so với nhiều hệ thống nhận diện khác hiện nay.

Khi bib đã được định vị, công việc tiếp theo là của thuật toán nhận dạng ký tự - số hóa các thông tin ghi trên bib, chuyển đổi thành các chữ và số. Sau đó, máy tính sẽ lọc trong những ký tự ấy để lấy ra số báo danh. Các thuật toán đặc biệt sẽ được ứng dụng trong trường hợp tấm bib bị che khuất một phần để giảm tình trạng sót ảnh của vận động viên.

Quy trình nhận diện người và đọc bib do VnExpress phát triển.

Sau khi hoàn thiện, quy trình đọc số bib trên được "đóng gói" vào các "docker". Mỗi docker có khả năng xử lý ảnh một cách hoàn chỉnh và độc lập, vì vậy, nếu cần đẩy nhanh thời gian lọc ảnh hoặc tăng số lượng ảnh cần xử lý, quản trị viên chỉ cần bổ sung thêm docker vào hệ thống.

Trung bình mỗi docker mất khoảng 5 giây để đọc hết số bib trên một ảnh bất kỳ. Nếu có 60 nghìn ảnh đổ về, tổng thời gian xử lý là trên dưới 8 tiếng, nếu sử dụng 10 docker. Theo ông Vũ, thời gian thực tế còn ngắn hơn do hình ảnh thường được tải lên hệ thống liên tục trong quá trình thi đấu. Vì vậy, các vận động viên có thể nhận ảnh của mình ngay trong ngày.

Võ Trọng Tấn, một runner đến từ Quảng Nam, đánh giá VnExpress Marathon Quy Nhơn 2020 là một trong những giải chạy công bố ảnh sớm nhất hiện nay. Trong khi tại nhiều đơn vị khác, người tham gia phải đợi một tuần, thậm chí một tháng mới có ảnh, với VnExpress Marathon chỉ dưới một ngày.

Hệ thống lọc ảnh của giải cũng được đánh giá là "ấn tượng" bởi có thể tìm chính xác cả bib bị che khuất một phần. Anh Tấn chia sẻ, ban đầu, anh lo không có ảnh ở cự ly 21 km, do trời nắng gắt, phần bid lại màu cam dễ bị 'cháy sáng'. Tuy nhiên, khi tìm được ảnh của mình dễ dàng, anh thấy "thật bất ngờ".

Khả năng đọc dữ liệu trên ảnh của hệ thống phụ thuộc một phần vào chất lượng ảnh nguồn. Theo ông Lộc Vũ, hệ thống của VnExpress có khả năng xử lý đến từng pixel của ảnh, vì vậy, một số hình mắt thường nhìn khó, máy vẫn đọc được. Ngoài ra, hệ thống cũng có khả năng xử lý ảnh trên nhiều độ phân giải, đáp ứng sự đa dạng về các thể loại máy ảnh, ống kính của nhiếp ảnh gia tại VnExpress Marathon.

Sau một ngày, đã có hàng chục nghìn lượt truy cập vào hệ thống ảnh của VnExpress Marathon Quy Nhơn 2020. Khả năng nhận diện số bib được vận động viên đánh giá cao khi nhận diện chính xác 93% ảnh.

Sản phẩm được đội ngũ kỹ thuật của VnExpress nghiên cứu và thử nghiệm trong 4 tháng, đã đạt được những thành công bước đầu. "Chúng tôi sẽ tiếp tục hoàn thiện hệ thống nhận diện ảnh theo số bib. Mục tiêu là nâng cao tốc độ xử lý cũng như cải thiện độ chính xác, nhằm phục vụ cho các giải VnExpress Marathon sau này, hoặc cung cấp cho các đơn vị có nhu cầu", ông Vũ nói.

Theo VnExpress

Các tin bài khác