The innocent WeiDa 🐂 AI con chip hỏng gây ra Google chờ khách hàng đâm chỉ riêng, ảnh hưởng nhiều nhỏ? Diver Vào thứ hai, ngày 13 tháng 1, theo báo The Information, vidia mới nhất # trí tuệ nhân tạo # có khả năng chip Blackwell đã gặp vấn đề kỹ thuật khi triển khai nó vào trung tâm dữ liệu, bao gồm chủ yếu một trục trặc trong khung máy chủ và một sự kết nối bất thường giữa các chip. Những vấn đề này với trung tâm dữ liệu của tiến trình triển khai gây ra ép buộc, nhà hoàng innocent WeiDa nhiều khách hàng (bao gồm Microsoft 🐂, amazon 🐂 cờ AWS bình, Google 🐂, Meta 🐂) sau khi các nhà gây nhiều khách hàng đề trung tâm dữ liệu và làm các đơn đặt hàng tiêu biến, kế hoạch cắt rồi một phần trong quá khứ Blackwell GB200 JiJia làm các đơn đặt hàng của tôi. Vì sự trì hoãn giao hàng, Microsoft đã lên kế hoạch lắp đặt một số lượng lớn GB200 của trung tâm dữ liệu phoenix bây giờ đã cài đặt con chip H200. Có nguồn tin cho biết nếu vidia không giải quyết được những vấn đề này, hiệu suất của nó có thể cao hơn mức mà công ty đã hứa. Sau khi công bố, cổ phiếu mỹ của nvidia đã giảm xuống dưới 4.7% trong buổi sáng, lên 1.97% tại 133.23 bảng. Khách hàng chính cắt giảm đơn đặt hàng và tìm kiếm một giải pháp thay thế cho chip Blackwell được trông đợi bởi sự xuất sắc và năng lượng hiệu quả thấp. Hiệu quả năng lượng của Blackwell tăng gấp 4 lần so với thế hệ trước của Hopper, và nó phù hợp với những nhà công nghệ khổng lồ như Microsoft, amazon, Google và Meta. Mỗi công ty đã ra lệnh trị giá hơn 10 tỉ đô la. Tuy nhiên, việc lắp nhiều chip tiêu thụ năng lượng cao vào một khung máy chủ là một thử thách lớn hơn mong đợi. Mỗi khung máy Blackwell cao hơn cả tủ lạnh nhà và cân bằng một chiếc Honda civic. Vì mật độ xếp hạng rất cao, khung phải sử dụng hệ thống làm mát bằng nước thay vì hệ thống làm mát bằng gió truyền thống. Với hầu hết các nhà phát triển al và các nhà điều hành trung tâm dữ liệu, triển khai khung cụ thể này là một nhiệm vụ mới và phức tạp. Hơn nữa, không phải tất cả các trung tâm dữ liệu đều đáp ứng được nhu cầu môi trường thị trường của người dùng, và khách hàng phải lập kế hoạch triển khai một lần nữa. Một số khách hàng đã cắt giảm đơn đặt hàng cho khung GB200 của Blackwell vì vấn đề nhiệt độ và kết nối. Ví dụ, một số khách hàng chọn ra những phiên bản được cải tiến mà có thể sẽ ra mắt vào cuối năm nay, và một số khác lên kế hoạch đặt hàng những con chip AI cũ của nvidia như là một giải pháp thay thế. Mặc dù nvidia đã đề nghị một giải pháp hai máy, nhưng một số khách hàng có thể đổi sang bán một mình con chip Blackwell để tự lắp ráp. Bất chấp thử thách, vidia vẫn có cơ hội cứu vãn tình hình. Nếu những vấn đề kỹ thuật này được giải quyết kịp thời, khách hàng có thể giảm đơn đặt hàng trở lại. Ngoài ra, mặc dù có vấn đề với giá đỡ, con chip Blackwell vẫn hoạt động tốt hơn so với thế hệ trước, và nvidia có thể tìm ra người mua khác cho giá đỡ đó. Vào tháng 11 năm ngoái, nvidia dự đoán một thế hệ mới của con chip al Blackwell sẽ tạo ra lợi nhuận hàng tỷ đô la cho công ty trong quý đầu tiên của năm nay, và giúp tăng nhanh doanh thu từ 47.5 tỉ đô la cho con chip trung tâm dữ liệu đến 150 tỉ đô la. Hiệu quả năng lượng cao của chip Blackwell vốn là yếu tố quan trọng để thu hút các nhà cung cấp dịch vụ đám mây, những nhà cung cấp muốn đạt được hiệu quả điện toán cao hơn trong khi các điều kiện năng lượng được thắt chặt. Sự trì hoãn của con chip ảnh hưởng đến kế hoạch triển khai trung tâm dữ liệu theo nguồn tin cho biết, là nhà cung cấp máy chủ của OpenAI, Microsoft dự định cài đặt ít nhất 50.000 chip Blackwell GB200 khung trong một cơ sở ở phoenix. Tuy nhiên, vì giao hàng của Blackwell bắt đầu bị trì hoãn từ năm ngoái, OpenAI đề nghị Microsoft cung cấp nhiều hơn thế hệ trước của vidia H200 chip càng sớm càng tốt. Sự thay đổi này đã dẫn đến việc các trung tâm dữ liệu phoenix được lên kế hoạch lắp đặt GB200 giờ đã đầy các chip H200. Theo nguồn tin cho biết, Microsoft đang dự định cài đặt khung GB200 chứa 12.000 chip Blackwell trong một cơ sở ở phoenix vào tháng 3 năm nay, khoảng 1/4 so với dự án ban đầu. Một người khác làm việc với Microsoft cho biết công ty cũng có kế hoạch mua sắm khi giá Blackwell GB300 ra mắt vào cuối năm nay. Vidia có kế hoạch bắt đầu giao hòm Blackwell cho khách hàng vào cuối năm ngoái, nhưng bị trì hoãn trong ba tháng vì lỗi thiết kế chip. Mặc dù nvidia đã hồi phục được vấn đề này, đến tháng 11, khách hàng bắt đầu lo sợ về việc quá nóng trong khung. Vì vậy, nvidia đã nhiều lần yêu cầu nhà cung cấp sửa đổi thiết kế. Tuy nhiên, vấn đề không được giải quyết hoàn toàn. Theo như ba người tham gia thử nghiệm khung, khách hàng cũng nhận ra có sự mâu thuẫn trong truyền tải dữ liệu giữa các chip (mạng lưới). Những vấn đề này có thể làm cho khung của Blackwell được thiết lập lâu hơn dự kiến, và nếu vidia không giải quyết được những vấn đề này, hiệu quả có thể sẽ thấp hơn mức mà công ty đã hứa.