Cách đào tạo AI lạ kỳ của Facebook có thể khiến bạn kinh ngạc
Ứng dụng AI đang được xem là một xu hướng của toàn cầu, và cũng được xem là một công cụ quan trọng không thể thiếu trong tương lai. Nắm rõ được sự cần thiết của việc tích hợp AI vào trong bộ máy vận hành, Facebook đã sử dụng cơ sở dữ liệu hình ảnh khổng lồ của Instagram để xây dựng thành công một AI có thể “nhìn thấy” những gì nó nhìn thấy. Điều này làm bạn có bất ngờ không? Chứ đối với trang thì là một bất ngờ lớn, vậy chúng ta cùng tìm hiểu thêm về điều này nhé.
Cùng nhau tìm hiểu sơ qua về AI
Trong thời đại công nghệ 4.0, đi đâu người ta cũng nhắc đến AI, và thậm chí mọi người còn xem AI như một “tượng đài” trong công nghệ máy tính hơn chỉ là xu hướng đơn thuần.
Bản chất của AI là mô hình, thuật toán được huấn luyện trên một tập dữ liệu để giải quyết một bài toán rất cụ thể. AI giống như một đứa bé sơ sinh vậy. Nó bắt đầu thu nhận hình ảnh và học cách phân loại. Nó chỉ có thể nhận diện gương mặt ba; mẹ hoặc ông bà chứ không thể làm gì khác nữa.
Hiện nay, công nghệ AI có 3 hướng chính:
- Xử lý hình ảnh (Computer Vision).
- Xử lý ngôn ngữ tự nhiên (Natural Language Processing).
- Xử lý tín hiệu âm thanh (Audio Signal Processing).
Hiểu nôm na thì AI là trí tuệ nhân tạo, trí tuệ này phải hoàn thiện. Để làm nên trí tuệ đấy, chúng ta phải có máy học Machine Learning. Bên trong Machine Learning có nhiều cách thức, thuật toán để học thì Deep Learning là nổi bật nhất.
Cơ sở dữ liệu để xây dựng thành công AI của Facbook
Facebook đã tận dụng cơ sở dữ liệu hình ảnh khổng lồ của Instagram. Để xây dựng thành công AI có khả năng “nhìn” được nội dung đang thấy.
Theo bộ phận Facebook AI Research; chương trình thị giác máy tính mới có biệt danh là Seer (SElf-SupERvised). Trong bài kiểm tra nhận dạng vật thể do ImageNet – cơ sở dữ liệu hình ảnh quy mô lớn được thiết kế để sử dụng trong nghiên cứu phần mềm nhận dạng đối tượng trực quan – Seer. Nó đã đạt “điểm phân loại chính xác” lên tới 84,2%, cao nhất từ trước đến nay.
Hiện tại, hầu hết chương trình AI ở lĩnh vực thị giác máy tính đều được huấn luyện dựa trên các bức ảnh đã phân loại kỹ và dán nhãn nội dung cẩn thận. Tuy nhiên, Facebook cho biết Seer đã có thể tự “học” thông qua việc phân tích hình ảnh Instagram ngẫu nhiên. Không cần dựa trên nhãn gắn và chưa được xác định nội dung. Kỹ thuật này được gọi là học tập tự giám sát (self-supervised learning).
Học tập tự giám sát là kỹ thuật về AI được giới khoa học chú ý gần đây. Mô hình này có ưu điểm là cần ít dữ liệu, cũng như không cần phân loại và quản lý dữ liệu, qua đó có thể hoạt động với các tập dữ liệu lớn hơn và đa dạng hơn.
Chia sẻ của đại diện Facebook về dự án
“Tương lai của AI là tạo ra các hệ thống có thể tự học trực tiếp từ bất kỳ thông tin nào chúng được cung cấp. Kể cả đó là văn bản, hình ảnh hay một loại dữ liệu nào khác. Chúng sẽ tự học cách nhận ra các đối tượng trong một bức ảnh, diễn giải một khối văn bản hoặc thực hiện bất kỳ tác vụ nào được yêu cầu”, đại diện Facebook viết trên blog. “Hiệu suất của Seer đang chứng minh việc học tập tự giám sát của AI có thể thực hiện được. Có thể xem đây là bước đột phá cuối cùng, mở ra con đường cho các mô hình thị giác máy tính linh hoạt, chính xác và thích ứng hơn trong tương lai”.
Tiềm năng dự án
Cũng theo đại diện Facebook, dù chỉ là một dự án nghiên cứu; tiềm năng ứng dụng của Seer là rất lớn. Chẳng hạn, AI này có thể tối ưu hóa văn bản mô tả hình ảnh trên Facebook cho những người bị khiếm thị. pPhân loại tự động chính xác các mặt hàng được bán trên Facebook Marketplace cũng như xác định và loại bỏ các hình ảnh có nội dung độc hại trên Facebook.
Tuy nhiên, việc sử dụng hình ảnh công khai trên Instagram. Để đào tạo AI của Facebook đang vấp phải chỉ trích rất lớn. Theo CNBC, nhiều người dùng mạng xã hội này ngạc nhiên khi biết rằng hình ảnh của họ đang được sử dụng để dạy AI.
Quyền sử dụng thông tin trên nền tảng hỗ trợ
“Chúng tôi đã thông báo cho các chủ tài khoản Instagram trong chính sách dữ liệu, rằng Facebook có quyền sử dụng thông tin trên nền tảng để hỗ trợ nghiên cứu và đổi mới, bao gồm cả những công nghệ như thế này”. Theo Priya Goyal, kỹ sư phần mềm tại Facebook AI Research, nói với CNBC.
Đại diện Facebook cũng cho biết sẽ mở mã nguồn Seer; để các nhà nghiên cứu có thể thử nghiệm. Tuy nhiên, công ty khẳng định sẽ không chia sẻ hình ảnh của người dùng ra bên ngoài.
Bên cạnh Facebook, một số “ông lớn” công nghệ khác cũng đang quan tâm đến lĩnh vực thị giác máy tính. Năm ngoái, Google công bố chương trình thị giác máy tính có tên SimCLRv2; trong khi OpenAI cũng giới thiệu iGPT 2.
QTL hy vọng bài viết mang lại thông tin bổ ích cho bạn.
Nguồn: vnexpress.net