Thực hành với câu trả lời của Google Tìm kiếm cho ChatGPT

Cuối tuần trước, tôi đã sử dụng Google Tìm kiếm để được trợ giúp tìm hiểu xem tôi cần bao nhiêu tem để dán lên một lá thư nặng 8 ounce. (Đương nhiên là tôi đã gửi một bản sao của số mới nhất của WIRED!). Đó chính xác là loại câu hỏi mà tôi hy vọng tính năng AI tổng hợp mới của Google Tìm kiếm mà tôi đã thử nghiệm trong tháng qua sẽ giải quyết nhanh hơn nhiều so với khả năng tôi có thể thực hiện thông qua trình duyệt của chính mình.

Google có cái tên vụng về là Search Generative Experience, viết tắt là SGE, đưa vào hộp tìm kiếm của nó chức năng đàm thoại giống ChatGPT. Bạn có thể đăng ký tại Phòng thí nghiệm tìm kiếm của Google. Công ty cho biết họ muốn người dùng trò chuyện với chatbot tìm kiếm, được ra mắt cho người thử nghiệm vào tháng 5, để tìm hiểu sâu hơn về các chủ đề và đặt những câu hỏi mang tính thử thách và trực quan hơn so với việc họ gõ vào một hộp truy vấn cũ nhàm chán. Và các câu trả lời do AI tạo ra nhằm sắp xếp thông tin rõ ràng hơn trang kết quả tìm kiếm truyền thống—ví dụ: bằng cách tập hợp thông tin từ nhiều trang web. Hầu hết các tìm kiếm trên web trên thế giới đều thông qua Google và Google đã phát triển công nghệ AI lâu hơn hầu hết các công ty, vì vậy thật công bằng khi mong đợi trải nghiệm đỉnh cao.

Lý thuyết cũng vậy. Hóa ra trên thực tế, tính năng mới còn gây phiền toái hơn nhiều so với tính năng trợ lý. Nó chậm, không hiệu quả, dài dòng và lộn xộn—sự can thiệp giả tạo hơn là trí thông minh.

Sau khi bạn có quyền truy cập vào bài kiểm tra của Google, hộp tìm kiếm sẽ không thay đổi. Nhưng để trả lời câu hỏi như “Có bao nhiêu con tem để gửi một lá thư nặng 8 ounce”, một phần mới chiếm một phần lớn màn hình, đẩy danh sách liên kết thông thường xuống. Trong khu vực đó, các mô hình ngôn ngữ lớn của Google tạo ra một số đoạn văn tương tự như những gì bạn có thể tìm thấy từ ChatGPT hoặc Bing Chat của Microsoft. Các nút ở phía dưới dẫn đến giao diện chatbot nơi bạn có thể đặt các câu hỏi tiếp theo.

Điều đầu tiên tôi nhận thấy về tầm nhìn của Google về tương lai tìm kiếm là sự chậm chạp của nó. Trong các thử nghiệm mà tôi điều khiển ứng dụng đồng hồ bấm giờ bằng một tay và gửi truy vấn bằng tay kia, đôi khi phải mất gần sáu giây để trình tạo văn bản của Google đưa ra câu trả lời. Định mức là hơn ba giây, so với không quá một giây đối với kết quả thông thường của Google xuất hiện. Mọi thứ có thể còn tồi tệ hơn: Tôi đã thực hiện các thử nghiệm của mình sau khi Google tung ra bản cập nhật mà họ tuyên bố đã tăng gấp đôi tốc độ của bot tìm kiếm vào tháng trước. Tuy nhiên, tôi vẫn thường xuyên đọc các kết quả thường xuyên vào thời điểm AI tổng hợp kết thúc, nghĩa là cuối cùng tôi đã bỏ qua các luận văn được nộp muộn của nó. Cathy Edwards, phó chủ tịch Google Tìm kiếm, cho tôi biết việc tối ưu hóa tốc độ của phần mềm AI làm nền tảng cho công cụ này đang diễn ra.

Người ta có thể tha thứ cho sự chậm chạp của hình thức tìm kiếm mới này nếu kết quả có giá trị. Nhưng độ chính xác là không rõ ràng. Câu trả lời AI tổng hợp gồm năm câu của Google cho câu hỏi về tem của tôi bao gồm các lỗi rõ ràng về cả phép nhân và phép trừ, giá tem đã lỗi thời hai năm và các câu hỏi tiếp theo được đề xuất bỏ qua các biến quan trọng đối với chi phí vận chuyển, chẳng hạn như hình dạng, kích thước và điểm đến. Tuyên bố từ chối trách nhiệm mà Google hiển thị ở đầu mỗi câu trả lời do AI tạo ra hoàn toàn đúng: “AI sáng tạo đang mang tính thử nghiệm. Chất lượng thông tin có thể khác nhau.”

Trong cùng một phản hồi, tính năng tìm kiếm mới của Google gợi ý rằng tôi sẽ cần những con tem trị giá 2,47 đô la hoặc 4 đô la. Điều hướng đến máy tính trực tuyến của Bưu điện Hoa Kỳ đã đưa ra câu trả lời chính thức: Tôi cần 3,03 đô la, hoặc năm con tem với giá 66 xu mỗi con với khoản thanh toán vượt mức 27 xu. Edwards của Google cho biết truy vấn khiêm tốn của tôi đã đẩy giới hạn hiện tại của công nghệ. “Chắc chắn là ở biên giới,” cô nói.

Thật không may, việc im lặng cũng không có kết thúc tốt đẹp. Khi được hỏi giá của một con tem, Google đã trả lời bằng một con số lỗi thời. Chỉ cần xác định rõ rằng tôi muốn mức giá của tháng này là hệ thống đã phản ánh chính xác mức tăng chi phí 3 xu trong tháng này. Công bằng mà nói, ChatGPT cũng sẽ loại bỏ truy vấn này vì dữ liệu đào tạo của nó sẽ bị cắt vào năm 2021 — nhưng nó không được coi là công cụ thay thế cho công cụ tìm kiếm.

Trải nghiệm tìm kiếm mới của Google có vẻ không đủ tin cậy nên tốt hơn hết tôi chỉ nên nhấp qua các kết quả tiêu chuẩn để tiến hành nghiên cứu của riêng mình. Một truy vấn về các trò chơi điện tử Star Wars do nhà sản xuất trò chơi Electronic Arts phát triển đã tạo ra một danh sách chính xác ngoại trừ việc bao gồm một tựa game từ đối thủ EA Ubisoft. Trớ trêu thay, mô tả về AI của trò chơi trong kết quả cho biết nó được tạo ra bởi Ubisoft, cho thấy các mô hình ngôn ngữ lớn có thể mâu thuẫn với chính chúng như thế nào.

Khi được hỏi về những cầu thủ mà đội San Diego Padres—đội chắc chắn sẽ đánh bại Steven’s Phillies để giành được suất đặc cách—có thể cố gắng giành được thông qua trao đổi với một đội bóng chày khác, phản hồi AI của Google bắt đầu với hai cầu thủ hiện đang ở Padres, gây nhầm lẫn cho các chip giao dịch là các mục tiêu thương mại.

Google đã đưa ra một số biện pháp bảo vệ. Trải nghiệm tìm kiếm mới không hiển thị đối với một số truy vấn về sức khỏe hoặc tài chính mà Google đã đặt tiêu chuẩn cao hơn về độ chính xác. Và trải nghiệm hầu như luôn nổi bật với các liên kết đến các tài nguyên liên quan trên web để giúp người dùng chứng thực kết quả đầu ra của AI. Kết quả trên các truy vấn như “Viết một bài thơ” có tuyên bố từ chối trách nhiệm “Bạn có thể thấy nội dung sáng tạo không chính xác”. Và hệ thống AI nhìn chung sẽ không cố gắng tỏ ra quá dễ thương hoặc áp dụng một tính cách nào đó. “Chúng tôi không nghĩ mọi người thực sự muốn nói chuyện với Google,” Edwards nói, tạo ra sự tương phản với Bing Chat, vốn được biết đến là đưa vào bài phát biểu ở góc nhìn thứ nhất hoặc rắc các biểu tượng cảm xúc.

Đôi khi, tầm nhìn mới của Google về tìm kiếm có thể giống như một bước lùi hơn là một bước nhảy vọt vào tương lai. Các câu trả lời được tạo ra có thể trùng lặp với các tính năng khác trên trang kết quả, chẳng hạn như các đoạn trích nổi bật đưa ra câu trả lời rõ ràng và dễ hiểu từ một trang web hoặc các hộp kiến ​​thức cung cấp cái nhìn tổng quan dài từng đoạn về một chủ đề từ Wikipedia. Khi nó đưa ra những kết quả như vậy một cách muộn màng, phiên bản AI tổng quát có xu hướng dài dòng nhất và khó hiểu nhất.

Edwards đã đề cập ít nhất tám lần trong cuộc thảo luận kéo dài 30 phút của chúng tôi về trải nghiệm của tôi với tính năng mới rằng tính năng này vẫn còn ở giai đoạn đầu trong quá trình phát triển và còn nhiều vướng mắc cần giải quyết. “Tôi không nghĩ bạn sẽ nghe tôi nói rằng chúng ta đã làm được điều này,” cô nói. “Chúng ta đang ở giai đoạn đầu của vòng chuyển đổi kéo dài 10 năm.” Cô ấy cũng cho biết phản hồi cho đến nay là “cực kỳ tích cực”, nhưng có lẽ quan trọng nhất là cô ấy nói rằng những gì Google cuối cùng sẽ ra mắt cho tất cả người dùng “có thể trông khá khác so với hiện tại của chúng tôi”.

Một trải nghiệm nhanh hơn, ít nội dung hơn và có thể giúp gửi các số WIRED đến độc giả mà không khiến họ gặp nguy cơ bị trả lại vì bưu phí trả thấp sẽ rất tuyệt.

Du hành thời gian

Nhiệm vụ của Google là trả lời thẳng thắn các câu hỏi của người dùng bằng các câu trả lời trực tiếp đã bắt đầu từ nhiều năm trước. Trở lại năm 2016, nhà văn Cade Metz của WIRED lúc bấy giờ đã viết về cách Google tập hợp khoảng 100 tiến sĩ ngôn ngữ học thông thạo khoảng hai chục ngôn ngữ để cô đọng văn bản và chú thích các câu nhằm giúp đào tạo các hệ thống AI hiểu cách hoạt động của ngôn ngữ con người. Google kỳ vọng đội ngũ và công nghệ sẽ phát triển trong nhiều năm tới.

Những “thuật toán nén câu” này vừa xuất hiện trên phiên bản máy tính để bàn của công cụ tìm kiếm. Họ xử lý một nhiệm vụ khá đơn giản đối với con người nhưng theo truyền thống lại khá khó khăn đối với máy móc. Chúng cho thấy deep learning đang thúc đẩy nghệ thuật hiểu ngôn ngữ tự nhiên, khả năng hiểu và phản hồi lời nói tự nhiên của con người như thế nào. David Orr, giám đốc sản phẩm nghiên cứu của Google, nói về công việc nén câu của công ty: “Bạn cần sử dụng mạng lưới thần kinh – hoặc ít nhất đó là cách duy nhất mà chúng tôi tìm ra để làm được điều đó”.

Google đào tạo các mạng thần kinh này bằng cách sử dụng dữ liệu được tạo thủ công bởi một nhóm lớn các nhà ngôn ngữ học tiến sĩ mà họ gọi là Pygmalion. Trên thực tế, máy của Google học cách trích xuất các câu trả lời có liên quan từ chuỗi văn bản dài bằng cách xem con người thực hiện việc đó—lặp đi lặp lại. Những nỗ lực chăm chỉ này cho thấy cả sức mạnh lẫn những hạn chế của deep learning. Để đào tạo các hệ thống trí tuệ nhân tạo như thế này, bạn cần rất nhiều dữ liệu đã được trí tuệ con người sàng lọc. Loại dữ liệu đó không dễ dàng có được—hoặc không hề rẻ. Và nhu cầu về nó sẽ không sớm biến mất.

Nhưng chỉ một năm sau, Các nhà nghiên cứu của Google đã nghĩ ra một cách tiếp cận mới đến việc đào tạo AI khiến phần lớn việc chuẩn bị đó trở nên không cần thiết và dẫn đến các mô hình ngôn ngữ lớn làm nền tảng cho các dịch vụ như ChatGPT và Google Tìm kiếm mới. Nhìn lại, tôi sẽ không bận tâm đến những đoạn trả lời rõ ràng trên Google Tìm kiếm của những năm trước.

Hỏi tôi một điều

Jennifer Phoenix, thông qua Facebook, hỏi tại sao trình tạo hình ảnh AI tiếp tục mắc lỗi bàn tay và ngón tay. “Tôi đọc là do sự phức tạp,” cô nói, “nhưng tôi nghĩ cách khắc phục là đào tạo nhiều hơn về các tính năng đó.”

Tôi ở bên bạn, Jennifer. Sau khi đọc câu hỏi của bạn, tôi đã thử tạo hình ảnh “bàn tay có hình xăm chiếc nhẫn mặt trời lặn” trong một phiên bản demo của công cụ AI Khuếch tán ổn định. Lô bốn kết quả mà tôi nhận được có các ngón tay và bàn tay rời rạc, lung lay, mất chữ số, cổ tay thon thả bất thường hoặc các đốt ngón tay khổng lồ. Ngược lại, truy vấn “khuôn mặt có hình xăm mặt trời lặn ở má” lại cho ra một số hình ảnh hoang dã, nhưng ít nhất các khuôn mặt trông rất thực tế.

Hình ảnh do AI tạo ra.

Khuếch tán ổn định qua Paresh Dave

Leave a Comment

Your email address will not be published.