Mỗi năm trôi qua, máy móc lại vượt qua con người trong nhiều hoạt động mà ta từng nghĩ chỉ loài người mới làm được. Máy tính ngày nay có thể đánh bại con người trong những ván cờ phức tạp, chuyển dịch giọng nói từ các thứ tiếng, ngôn ngữ khác nhau hoặc ngay lập tức nhận diện hầu hết tất cả các vật thể và học cách để phán đoán cảm xúc của chúng ta.
Nhưng liệu đó có là vấn đề?
Bởi vì nếu máy móc và người điều khiển chúng có thể đọc các trạng thái cảm xúc của con người, chúng sẽ trợ giúp hoặc điều khiển chính chúng ta trên một quy mô chưa từng có tiền lệ.
Nhưng trước khi chúng ta đến được bước đó, hãy hỏi tại sao một thứ phức tạp như cảm xúc có thể chuyển đổi thành những con số – thứ ngôn ngữ duy nhất máy tính hiểu được?
Về bản chất, điều đó cũng tương tự như cách não chúng ta diễn tả cảm xúc bằng cách học để phát hiện ra chúng. Nhà tâm lý học người Mỹ Paul Ekman đã phân chia ra các loại cảm xúc phổ biến được biểu hiện na ná nhau ở đa số các nền văn hoá. Ví dụ như một nụ cười được các cư dân của xã hội hiện đại định nghĩa là dấu hiệu cho điều gì đó hạnh phúc, vui vẻ, và các thổ dân cũng cho kết quả tương tự.
Và theo Ekman, cảm xúc tức giận, căm ghét, sợ hãi, vui vẻ, buồn bã và bất ngờ đều được nhìn nhận theo cách tương tự chung giữa mọi người.
Máy móc ngày càng đạt nhiều tiến bộ trong lĩnh vực nhận diện hình ảnh nhờ có các thuật toán học máy như mạng nơ-ron nhân tạo. Những mạng lưới ấy bao gồm các giao điểm (nodes) có thể bắt chước theo các nơ-ron thần kinh của con người bằng cách tạo ra các liên kết và trao đổi thông tin.
Để ‘huấn luyện’ mạng lưới đó, các dữ liệu mẫu đầu vào được phân loại trước thành các thư mục khác nhau, ví dụ như những tấm ảnh được đánh dấu là hạnh phúc hay buồn bã được đưa vào hệ thống. Mạng lưới sau đó sẽ học để phân loại các mẫu bằng cách điều chỉnh những tỉ trọng liên quan quyết định một đặc tính cụ thể. Càng nhiều dữ liệu huấn luyện được cung cấp, thuật toán phân tích càng có độ chính xác cao hơn khi xác định những bức ảnh mới.
Điều này tương tự như bộ não của chúng ta: não học từ những trải nghiệm trong quá khứ và hình thành các quá trình kích thích xung thần kinh.
Thuật toán nhận diện không giới hạn với mỗi biểu cảm trên khuôn mặt. Cảm xúc của chúng ta được biểu lộ theo nhiều cách khác: ngôn ngữ cơ thể, tông giọng, nhịp tim, nhiệt độ cơ thể, nước da hay thậm chí cả cách dùng câu từ khi viết.
Theo Neurodata Lab, các thuật toán có thể phân tích được ra một con số khá chắc chắn về phần trăm cảm xúc của con người. Ví dụ như qua một nội dung nghe-nhìn, nó có thể đoán được một người đang trải qua cảm xúc với 96% là sự vui vẻ, 3,6% là sự ngạc nhiên và 0,4% là các cảm xúc hỗn độn khác. Trong một vài trường hợp, thuật toán có những phán đoán sai, nhưng số lượng những trường hợp ấy vô cùng ít.
Robot đọc và linh hoạt phản ứng lại cảm xúc của con người có ứng dụng lớn vào quản lý chăm sóc khách hàng, tuyển dụng nhân sự, chatbot, trợ lý ảo và làm một người bạn dễ thương với con người như robot Vector của Anki.
Các lợi ích khác được hưởng từ việc máy tính biết nhận diện cảm xúc:
  • Robot sử dụng thuật toán nhận dạng biểu cảm trên khuôn mặt có thể giúp trẻ em học tập hay trở thành bạn đồng hành với những người cô đơn.
  • Các mạng xã hội sử dụng thuật toán để ngăn chặn các vụ tự tử bằng cách treo cờ vào các bài đăng chứa các từ và cụm từ nhất định (đã được Facebook ứng dụng từ năm 2017)
  • Các phần mềm nhận diện cảm xúc có thể giúp điều trị các chứng rối loạn tinh thần hay thậm chí cung cấp nền tảng giá rẻ với các phương thức trị liệu tự động.
Ngoài những lợi ích tiềm năng trên, viễn cảnh máy tính tự động scan ảnh của mọi người và các dấu hiệu sinh lý của cơ thể cũng đem đến các phiền toái nhất định:
  • Sự riêng tư của mỗi cá nhân sẽ ở đâu khi các tổ chức, doanh nghiệp khai thác cảm xúc của chúng ta qua các loại hình quảng cáo?
  • Quyền con người sẽ ở đâu nếu các nhà chức trách nghĩ rằng họ có thể xác định ai đó là tội phạm trước khi người đó thật sự có hành động phạm pháp?