Xuất Hiện Mô Hình AI Từ Trung Quốc Dám "thách Thức" ChatGPT - Là Công Nghệ Dành Cho Dân Mê Công Nghệ

Nội Dung Chính

TinLiên Quan

Top 3 tivi Samsung giá rẻ chỉ dưới 10 triệu: Hình ảnh nét căng, âm thanh đã tai không có điểm chê

Coca-Cola nhận mưa gạch đá vì dùng video quảng cáo “giả trân” tạo bằng AI

Nhiều cơ quan chính phủ Mỹ cấm nhân viên dùng AI tạo sinh

Công ty Trung Quốc DeepSeek chuyên nghiên cứu trí tuệ nhân tạo AI vừa công bố phiên bản thử nghiệm của DeepSeek-R1, mô hình trí tuệ nhân tạo mới nhất của họ, được thiết kế để cạnh tranh trực tiếp với mô hình ChatGPT o1 của OpenAI.

SIÊU SALES tháng 11 2024 Theo Ngành Hàng Shopee

DeepSeek-R1: Bước tiến trong khả năng lý luận

DeepSeek-R1 được mô tả là một mô hình lý luận tiên tiến, nổi bật với khả năng “tự kiểm chứng” thông qua việc dành nhiều thời gian hơn để xử lý câu hỏi hoặc truy vấn. Điều này giúp mô hình tránh được các sai sót phổ biến mà nhiều hệ thống AI khác thường gặp phải.

Tương tự o1, DeepSeek-R1 sử dụng phương pháp lý luận để thực hiện các nhiệm vụ, lập kế hoạch trước và thực hiện các chuỗi hành động phức tạp nhằm đưa ra câu trả lời. Tùy thuộc vào độ phức tạp của câu hỏi, DeepSeek-R1 có thể mất đến vài chục giây để “suy nghĩ” trước khi đưa ra phản hồi.

Theo DeepSeek, phiên bản thử nghiệm DeepSeek-R1-Lite-Preview có hiệu suất ngang bằng với o1-preview của OpenAI trên hai bộ đánh giá AI phổ biến: AIME và MATH. AIME sử dụng các mô hình AI khác để đánh giá hiệu suất, trong khi MATH kiểm tra khả năng giải quyết các bài toán ngôn từ. Tuy nhiên, DeepSeek-R1 không phải là hoàn hảo. Một số người dùng trên mạng xã hội X chỉ ra rằng mô hình này gặp khó khăn với các trò chơi logic đơn giản như tic-tac-toe, điều mà o1 cũng mắc phải.

Những thách thức và hạn chế

Bên cạnh những điểm mạnh, DeepSeek-R1 dễ dàng bị “jailbreak,” tức bị khai thác để bỏ qua các biện pháp bảo vệ. Một người dùng đã thành công trong việc khiến mô hình cung cấp công thức chi tiết để sản xuất ma túy methamphetamine.

Ngoài ra, DeepSeek-R1 từ chối trả lời các câu hỏi liên quan đến các vấn đề chính trị nhạy cảm. Khi được hỏi về Chủ tịch Trung Quốc Tập Cận Bình, sự kiện Thiên An Môn, hoặc kịch bản Trung Quốc xâm lược Đài Loan, mô hình đã từ chối phản hồi.

cfr0z3n_vector_art_line_art_flat_illustration_graphic_novel_spl_5e4ba6f6-8ff9-4899-a927-5e1aba...jpg

Hành vi này được cho là kết quả từ áp lực của chính phủ Trung Quốc đối với các dự án AI. Các mô hình tại đây phải trải qua quá trình đánh giá từ cơ quan quản lý Internet của Trung Quốc để đảm bảo nội dung phản hồi tuân thủ “các giá trị xã hội cốt lõi.” Chính phủ thậm chí được cho là đã đề xuất một danh sách đen các nguồn dữ liệu không được phép sử dụng để huấn luyện mô hình AI. Điều này dẫn đến việc nhiều hệ thống AI Trung Quốc tránh trả lời các chủ đề có thể gây phản ứng từ các cơ quan quản lý.

Thay đổi trong cách phát triển AI

Sự chú ý đến các mô hình lý luận như DeepSeek-R1 đang gia tăng trong bối cảnh “quy luật mở rộng quy mô” – lý thuyết cho rằng cung cấp nhiều dữ liệu và sức mạnh tính toán hơn sẽ làm tăng đáng kể khả năng của AI – đang bị đặt câu hỏi. Nhiều báo cáo gần đây cho thấy hiệu suất của các mô hình từ OpenAI, Google và Anthropic không còn cải thiện nhanh chóng như trước.

Xu hướng này thúc đẩy các phòng thí nghiệm AI lớn tìm kiếm những cách tiếp cận mới. Một trong số đó là “tính toán thời gian thực” (test-time compute), nền tảng của các mô hình như o1 và DeepSeek-R1. Phương pháp này cho phép mô hình dành thêm thời gian xử lý trong quá trình suy luận để hoàn thành nhiệm vụ.

CEO Microsoft Satya Nadella gần đây đã phát biểu tại hội nghị Ignite của công ty rằng, “Chúng ta đang chứng kiến sự xuất hiện của một quy luật mở rộng quy mô mới,” ám chỉ tầm quan trọng của test-time compute trong sự phát triển của AI.

Hậu thuẫn tài chính mạnh mẽ

DeepSeek dự kiến sẽ mở mã nguồn DeepSeek-R1 và cung cấp API trong tương lai gần. Công ty này nhận được sự hỗ trợ từ High-Flyer Capital Management, một quỹ đầu tư định lượng của Trung Quốc sử dụng AI để đưa ra các quyết định giao dịch.

DeepSeek trước đó đã gây áp lực lên các đối thủ lớn như ByteDance, Baidu và Alibaba khi ra mắt DeepSeek-V2, một mô hình phân tích văn bản và hình ảnh đa năng. Điều này buộc các công ty trên phải giảm giá hoặc thậm chí cung cấp miễn phí một số mô hình của họ.

High-Flyer tự xây dựng các cụm máy chủ để huấn luyện mô hình, cụm mới nhất sử dụng 10.000 GPU Nvidia A100 với chi phí lên tới 1 tỷ yên (~138 triệu USD). Doanh nghiệp này, do Liang Wenfeng – một cựu sinh viên khoa học máy tính – sáng lập, đặt mục tiêu đạt được AI “siêu thông minh” thông qua tổ chức DeepSeek.

Nội dung được tối ưu SEO từ Google và bài viết của https://vnreview.vn/threads/xuat-hien-mo-hinh-ai-tu-trung-quoc-dam-thach-thuc-chatgpt.50315/

5/5 - (78 bình chọn)

Hashtag: #10, #blog, #dichvugiare, #google, #sanphamchinhhang, #seo, #trend, #trending, #xuhuong

Tuyên bố miễn trừ trách nhiệm: Thông tin được cung cấp chỉ mang tính chất thông tin chung, https://lacongnghe.com không đưa ra bất kỳ tuyên bố hoặc bảo đảm nào liên quan đến thông tin, bao gồm nhưng không giới hạn bất kỳ sự tuyên bố hoặc bảo đảm về tính thích hợp cho bất kỳ mục đích cụ thể nào của thông tin theo phạm vi cho phép tối đa của pháp luật. Mặc dù đã nỗ lực để đảm bảo rằng thông tin được cung cấp trong bài viết này là chính xác, đáng tin cậy và hoàn chỉnh vào thời điểm đăng tải, nhưng thông tin được cung cấp trong bài viết này không nên được dựa vào để đưa ra bất kỳ quyết định tài chính, đầu tư, bất động sản, giao dịch hoặc pháp lý nào. Thêm vào đó, thông tin không thể thay thế lời khuyên từ một chuyên gia được đào tạo, người mà có thể xem xét, đánh giá các sự kiện và hoàn cảnh cá nhân của bạn, và chúng tôi không chịu bất kỳ trách nhiệm nào nếu bạn sử dụng những thông tin này để đưa ra quyết định. Xin cảm ơn!

Tags: 10 blog dichvugiare google sanphamchinhhang seo trend trending xuhuong

Xuất hiện mô hình AI từ Trung Quốc dám “thách thức” ChatGPT

Top 3 tivi Samsung giá rẻ chỉ dưới 10 triệu: Hình ảnh nét căng, âm thanh đã tai không có điểm chê

Coca-Cola nhận mưa gạch đá vì dùng video quảng cáo “giả trân” tạo bằng AI

Nhiều cơ quan chính phủ Mỹ cấm nhân viên dùng AI tạo sinh

SIÊU SALES tháng 11 2024 Theo Ngành Hàng Shopee

BEST DEAL tháng 11 2024 TRÊN AMAZON

SIÊU SALES tháng 11 2024 Trên TIKI

SIÊU SALES tháng 11 2024 Trên LAZADA

Top 3 tivi Samsung giá rẻ chỉ dưới 10 triệu: Hình ảnh nét căng, âm thanh đã tai không có điểm chê

Cùng Chuyên Mục

Galaxy A35 5G như viên ngọc quý làng Android, màn lớn như Galaxy S24 Ultra, mạnh vô đối phân khúc

Cháo chờ Nam Ô – món ăn ngon miền biển có cái tên độc lạ ở Đà Nẵng

Phúc Khang công bố dự án “Căn hộ xanh theo tiêu chuẩn Hoa Kỳ”

Lộ diện 8 chiếc iPhone sắp ra mắt khiến iFans ‘sốt rần rần’

Redmi Note 12 giảm hết ga hết số, trang bị toàn vẹn đe nẹt cả vua doanh số Android Galaxy A15

Vẫn còn hàng mới, Galaxy S23 Ultra giảm giá thủng sàn, tràn đầy trang bị ngon như Galaxy S24 Ultra

Giới thiệu về lan dendro bò tím

Bay cùng Vietjet đi muôn nơi, siêu khuyến mãi 0đ đến hết 2024

Dịch vụ thám tử là gì

Thuê thám tử theo dõi ngoại tình, nên hay không?

Tư vấn săn vé máy bay tết 2025 giá phù hợp

Chia đôi lá gan của một người chết não ghép cho hai bệnh nhân

Dịch vụ SEO tổng thể TPHCM – Tăng trưởng doanh thu hiệu quả ngay hôm nay!

Xây xẩm mặt mày: Nguyên nhân, triệu chứng và cách điều trị hiệu quả

Meta ra mắt ứng dụng Movie Gen tạo video AI bằng lời nhắc văn bản

Ai có nguy cơ suy nhược thần kinh?

Xuất hiện mô hình AI từ Trung Quốc dám “thách thức” ChatGPT

TinLiên Quan

SIÊU SALES tháng 11 2024 Theo Ngành Hàng Shopee

BEST DEAL tháng 11 2024 TRÊN AMAZON

SIÊU SALES tháng 11 2024 Trên TIKI

SIÊU SALES tháng 11 2024 Trên LAZADA

DeepSeek-R1: Bước tiến trong khả năng lý luận​

Những thách thức và hạn chế​

Thay đổi trong cách phát triển AI​

Hậu thuẫn tài chính mạnh mẽ​

Top 3 tivi Samsung giá rẻ chỉ dưới 10 triệu: Hình ảnh nét căng, âm thanh đã tai không có điểm chê

Cùng Chuyên Mục

DeepSeek-R1: Bước tiến trong khả năng lý luận

Những thách thức và hạn chế

Thay đổi trong cách phát triển AI

Hậu thuẫn tài chính mạnh mẽ