Transparency và Explainability – Hai nguyên tắc trọng yếu của AI
Trong lĩnh vực Trí tuệ nhân tạo (AI), hai trong số những nguyên tắc quan trọng giúp xây dựng niềm tin của người dùng đối với công nghệ là minh bạch (Transparency) và khả năng giải thích (Explainability). Những nguyên tắc này không chỉ giúp củng cố sự hiểu biết của chúng ta về các quyết định của AI mà bên cạnh đó, việc thông hiểu được nguyên lý AI hoạt động cũng góp phần xây dựng, điều chỉnh và phát triển hơn nữa những công nghệ tân tiến như trí tuệ nhân tạo.
Trong bộ 9 nguyên tắc quan trọng do Humane-AI đề xuất, hai nguyên tắc đầu tiên được đề cập là Transparecny (tính minh bạch) và Explainability (khả năng giải thích). Đây là hai nguyên tắc cơ bản và cần thiết để đảm bảo tính đạo đức trong xây dựng và ứng dụng AI, góp phần vào viễn cảnh bền vững của số hóa xã hội – nơi các công nghệ tiên tiến song hành và tác động trực tiếp đến cuộc sống của con người.
Transparency – Minh bạch trong AI là gì?
Minh bạch (Transparency) trong AI là nguyên tắc AI cung cấp các thông tin rõ ràng, dễ hiểu về nguyên lý hoạt động và cách thức hệ thống ra quyết định. Thông thường, AI – đặc biệt là các mô hình học sâu (deep learning) – được ví như một “hộp đen” (black box) vì quá trình xử lý bên trong rất phức tạp và khó giải thích. Điều này gây lo ngại vì nếu AI đưa ra một quyết định sai, chúng ta khó có thể biết tại sao. Khi AI minh bạch, các quy trình của nó có thể được theo dõi, kiểm tra và hiểu rõ hơn. Điều này giúp tăng niềm tin vào AI, đảm bảo tính công bằng và giúp con người có thể kiểm soát, điều chỉnh AI khi cần thiết.
Một ví dụ tiêu biểu về vấn đề minh bạch trong AI là trường hợp của Apple Card vào năm 2019. Lúc bấy giờ, Apple Card, một sản phẩm thẻ tín dụng do Apple và Goldman Sachs hợp tác phát hành, đã gặp phải tranh cãi liên quan đến việc phân biệt giới tính trong hạn mức tín dụng. Nhiều khách hàng phản ánh rằng phụ nữ nhận được hạn mức tín dụng thấp hơn đáng kể so với nam giới, mặc dù có hồ sơ tài chính tương đương. Điều này dẫn đến cáo buộc rằng thuật toán đánh giá tín dụng của Apple Card đã thiên vị giới tính.
Sự cố này là một ví dụ điển hình cho tính minh bạch thông tin và khả năng giải thích trong các hệ thống AI, đặc biệt là trong các lĩnh vực nhạy cảm như tài chính, nơi các quyết định có thể ảnh hưởng đáng kể đến cuộc sống của người dùng và cả doanh nghiệp.
Khả năng Giải thích – Explainability trong AI là gì?
Khả năng giải thích (Explainability) đề cập đến việc hệ thống AI có khả năng cung cấp thông tin chi tiết về cách thức và nêu rõ lý do hệ thống đưa ra một quyết định. Sử dụng một hệ thống AI có khả năng giải thích, người dùng có thể hiểu rõ lý do đằng sau một quyết định cụ thể thay vì chỉ nhận kết quả cuối cùng mà không rõ lý do đằng sau nó.
Trở lại với sự việc của Apple Card, ông David Heinemeier Hansson, một lập trình viên và doanh nhân, người đã công khai trên mạng xã hội rằng vợ ông nhận được hạn mức tín dụng chỉ bằng 1/20 so với ông, mặc dù họ có tài sản chung và khai thuế chung. Sự việc này đã thu hút sự chú ý rộng rãi và dẫn đến một cuộc điều tra từ Bộ Dịch vụ Tài chính bang New York về các cáo buộc phân biệt giới tính trong việc cấp hạn mức tín dụng của Apple Card.
Trong sự việc trên, nếu hệ thống AI của Apple Card có thể giải thích được lý do vì sao hạn mức tín dụng của người vợ chỉ bằng 1/20 so với chồng dù cả hai có tài sản chung và thu nhập ổn định, hệ thống AI của Apple Card sẽ được đánh giá là “có khả năng giải thích”.

Lợi ích của việc tuân thủ nguyên tắc Transparency và Explainability
Tuân thủ hai nguyên tắc đầu tiên trong bộ 9 nguyên tắc quan trọng do Humane-AI đề xuất mang đến cho cả nhà phát triển và người dùng một số lợi ích sau:
- Khả năng truy xuất nguồn gốc: Một yêu cầu quan trọng của minh bạch là các bộ dữ liệu và quy trình dẫn đến quyết định của AI phải được ghi lại và yêu cầu có thể truy vết được. Điều này giúp đảm bảo tính minh bạch, cho phép người dùng kiểm tra lại các thông tin khi cần.
- Khả Năng giải thích: Việc giải thích được lý do đằng sau quyết định của AI giúp của người phát triển và người dùng thông hiểu công cụ hơn, giảm bớt lo ngại về tính chính xác của AI.
- Khả năng giao tiếp: Khả năng này đề cập đến việc hệ thống có thể truyền đạt rõ ràng thông tin về AI đến người dùng và các bên liên quan. Từ đó, người dùng có thể nhanh chóng nắm được AI có thể làm gì, giới hạn của nó ra sao và nó hoạt động như thế nào để tận dụng vào công việc và cuộc sống.
Đối với FSOFT, việc tuân thủ hai nguyên tắc minh bạch (transparency) và khả năng giải thích (explainability) là những bước đầu tiên để các FSOFTers đảm bảo rằng hệ thống AI mình xây dựng không chỉ hoạt động tốt mà còn đáng tin cậy. Việc cung cấp một hệ thống AI minh bạch và có thể giải thích các quyết định cũng đồng nghĩa với việc FSOFT sẽ tạo ra một môi trường an toàn, dễ tiếp cận và có trách nhiệm cho người dùng.
Ngày nay, với các ngành công nghiệp trọng yếu như tài chính, y tế hay giáo dục…, việc đảm bảo tính minh bạch và khả năng giải thích có thể giúp giảm thiểu rủi ro và nâng cao độ tin cậy của công nghệ AI, từ đó ứng dụng hệ thống này rộng rãi hơn trong các lĩnh vực khác, mang lại giá trị tích cực cho xã hội.




