HỘI THI - GIẢI THƯỞNG

[THUẬT NGỮ AI CHALLENGE 2021 KỲ 1 – Scene Text Recognition là gì?]

Chủ đề của AI – CHALLENGE 2021 năm nay là “Nhận diện chữ tiếng Việt trong ảnh ngoại cảnh và sinh hoạt hàng ngày – Vietnamese Scene Text Recognition “. Đã có nhiều nghiên cứu đến từ các chuyên gia hàng đầu về CNTT trong ngành Trí tuệ nhân tạo (AI) nhằm tìm hiểu về công nghệ nhận diện mới này, song vẫn còn tồn tại nhiều thách thức trong việc tìm ra được lời giải về một thuật toán “siêu ưu việt” để có thể được áp dụng một cách rộng rãi.

(Xem thêm thông tin chi tiết bài báo tại: https://github.com/VinAIResearch/dict-guided)

Do đặc thù tiếng Việt có một cấu trúc rất đặc biệt gồm nhiều lớp ngữ nghĩa, dấu câu, kiểu viết và font chữ nên khi nhận diện thì thuật toán cần phải tối ưu để có thể xử lý được tất cả hình ảnh trong việc phát hiện (Detect) sau đó nhận diện (Recognize) chữ trong khung cảnh (Scene Text) trên các khu vực công cộng, biển báo, hay từ Google hình ảnh.

Vấn đề đặt ra là một phần quan trọng cho nhiều hệ thống thông minh hiện nay như Robot, Xe tự lái,… Các hệ thống này yêu cầu hiểu được cảnh vật xung quanh và chữ trong cảnh vật nắm giữ rất nhiều thông tin quan trọng. Để tăng tính ứng dụng thực tiễn của giải pháp, mô hình cần đáp ứng tốt được cả về độ chính xác cũng như về thời gian xử lý.

Ví dụ mô tả:

Các đội thi cần nhận diện chữ trong ảnh, trong đó phần lớn là tiếng Việt và được thu thập từ nhiều khu vực khác nhau. Hình ảnh chứa chữ có thể được chụp hoặc cắt ra từ video với nhãn được gán ở cấp độ tiếng. Cụ thể, từ “khe khẽ” sẽ được coi là hai tiếng riêng biệt “khe” và “khẽ”. Chữ trong hình ảnh được chia ra làm hai loại là dễ đọc và khó đọc. Cả hai loại chữ này đều được vẽ bounding box xung quanh (Polygon 4 cạnh cho mỗi tiếng). Điểm khác nhau là chữ dễ đọc sẽ được gán kèm nhãn là chữ chứa trong bounding box đó, trong khi các chữ khó đọc sẽ được gán nhãn là “###”. Kết quả đánh giá cuối cùng chỉ dựa trên những chữ dễ đọc. Ví dụ ở trong hình, chỉ những chữ bao gồm nhãn khác ### mới được sử dụng để đánh giá kết quả mô hình.

Định dạng lời giải:

Định dạng lời giải của các đội thi được xuất ra dạng văn bản một file .txt cho mỗi hình ảnh. Mỗi dòng sẽ biểu diễn cho một bounding box cùng nhãn của từ chứa trong bounding box đó. Ở đây bounding box là một polygon 4 góc, sẽ được biểu diễn bằng tọa độ của 4 điểm góc theo format:x1,y1,x2,y2,x3,y3,x4,y4,NhãnThứ tự quy ước theo chiều kim đồng hồ (clockwise).

Ví dụ: 231,124,275,110,270, 130,230,133,AnNhững thông tin tiếp theo sẽ được tiếp tục cập nhật ở Kỳ 2 – Thuật ngữ AI-CHALLENGE, các đội tuyển hãy cùng đón xem nhé, Ban tổ chức rất kỳ vọng 160 đội tuyển đến từ hơn 100 đơn vị, Viện nghiên cứu, trường đại học,… đã được ghi nhận trên hệ thống AI CHALLENGE 2021 đến thời điểm hiện tại sẽ nỗ lực và tìm ra được thuật toán đột phá cho Hội thi năm nay.

Các đội tuyển còn lại ơi!, hãy tiếp tục đăng ký tham gia, để ghi dấu vào bản đồ học thuật trải dài từ Việt Nam đến các quốc gia trong khu vực của Hội thi AI năm nay nhé!

Đăng ký tham gia và gửi bài dự thi lên hệ thống nộp bài của AI- CHALLENGE 2021, chủ đề: “Nhận diện chữ tiếng Việt trong ảnh ngoại cảnh và sinh hoạt hàng ngày” để có cơ hội được trải nghiệm các lớp đào tạo AI hoàn toàn miễn phí và được cấp chứng nhận từ Sở Thông tin và Truyền thông TP.HCM ngay tại đây: https://aichallenge.hochiminhcity.gov.vn/#AiChallenge2021

Có thể là hình ảnh về ngoài trời
Share This