Kết nối mạng AI
GPU là bộ não của máy tính AI
Nói một cách đơn giản, bộ xử lý đồ họa (GPU) đóng vai trò như bộ não của máy tính AI.
Có thể bạn đã biết, bộ xử lý trung tâm (CPU) là bộ não của máy tính. Lợi ích của GPU nằm ở chỗ nó chính là một CPU chuyên biệt trong việc thực hiện các phép toán phức tạp. Cách nhanh nhất để thực hiện phép toán này là để các nhóm GPU cùng giải một bài toán. Mặc dù vậy, việc huấn luyện mô hình AI vẫn có thể mất nhiều tuần hoặc thậm chí nhiều tháng. Sau khi hoàn tất xây dựng, nó sẽ được đặt trong hệ thống máy tính front-end và người dùng có thể đặt câu hỏi cho mô hình AI, quá trình này được gọi là suy luận.
Một máy tính AI chứa nhiều GPU
Kiến trúc tốt nhất để giải quyết các bài toán AI là sử dụng một nhóm GPU trong một giá máy, được kết nối với thiết bị chuyển mạch trên nóc giá máy này. Nhiều giá máy GPU có thể được kết nối bổ sung theo hệ thống phân cấp kết nối mạng. Khi các vấn đề cần giải quyết có độ phức tạp cao, yêu cầu về GPU cũng tăng lên, một số dự án có thể phải triển khai các cụm gồm hàng nghìn GPU.
Mỗi cụm AI là một mạng lưới nhỏ
Khi xây dựng cụm AI, cần thiết lập một mạng máy tính nhỏ để kết nối và cho phép các GPU cùng hoạt động, chia sẻ dữ liệu một cách hiệu quả.
Hình trên minh họa một Cụm AI trong đó các vòng tròn ở dưới biểu thị các quy trình công việc chạy trên GPU. GPU kết nối với các thiết bị chuyển mạch trên nóc giá máy (ToR). Các thiết bị chuyển mạch ToR cũng kết nối với các thiết bị chuyển mạch đường trục mạng biểu diễn phía trên sơ đồ, thể hiện một hệ thống phân cấp mạng rõ ràng cần thiết khi có nhiều GPU tham gia.
Mạng là điểm nghẽn trong quá trình triển khai AI
Mùa thu năm ngoái, tại Hội nghị thượng đỉnh toàn cầu của Dự án điện toán mở Open Computer Project (OCP), nơi các đại biểu cùng xây dựng thế hệ cơ sở hạ tầng AI tiếp theo, đại biểu Loi Nguyen từ Marvell Technology đã chỉ rõ một vấn đề quan trọng: "mạng là nút thắt cổ chai mới".
Về mặt kỹ thuật, độ trễ gói tin lớn hoặc mất gói tin do mạng bị tắc nghẽn có thể khiến các gói tin phải được gửi lại, làm tăng đáng kể thời gian hoàn thành công việc (JCT). Kết quả là một số lượng GPU trị giá hàng triệu hoặc hàng chục triệu USD của các doanh nghiệp bị lãng phí do hệ thống AI hoạt động không hiệu quả, gây thiệt hại cho doanh nghiệp cả về doanh thu và thời gian đưa sản phẩm ra thị trường.
Đo kiểm là điều kiện trọng yếu để vận hành thành công mạng AI
Để vận hành hiệu quả một cụm AI, GPU cần có khả năng sử dụng hết công suất để có thể rút ngắn thời gian huấn luyện và đưa vào sử dụng mô hình học để tăng tối đa tỷ lệ hoàn vốn đầu tư. Vì vậy, cần phải thử nghiệm và đánh giá hiệu năng của cụm AI (Hình 2). Tuy nhiên, nhiệm vụ này không dễ dàng, vì về mặt kiến trúc hệ thống có nhiều thiết lập và mối quan hệ giữa GPU và cấu trúc mạng cần bổ trợ cho nhau để xử lý bài toán.
Điều này tạo ra nhiều khó khăn thách thức trong việc đo kiểm mạng AI:
- Khó khăn trong việc tái tạo toàn bộ mạng sản xuất trong phòng thí nghiệm do hạn chế về chi phí, thiết bị, thiếu hụt về kỹ sư AI mạng có tay nghề cao, không gian, nguồn điện và nhiệt độ.
- Đo kiểm trên hệ thống sản xuất làm giảm năng lực xử lý khả dụng của chính hệ thống sản xuất.
- Khó khăn trong việc tái tạo chính xác các vấn đề do sự khác nhau về quy mô và phạm vi của các bài toán.
- Sự phức tạp trong cách thức kết nối tập thể của các GPU.
Để giải quyết những thách thức này, doanh nghiệp có thể tiến hành đo kiểm một tập hợp con của các thiết lập được đề xuất trong môi trường phòng thí nghiệm để đối chuẩn các tham số chính như JCT (thời gian hoàn thành công việc), băng thông mà nhóm AI có thể đạt được và so sánh với mức độ sử dụng nền tảng chuyển mạch và mức sử dụng bộ nhớ đệm. Phép đo đối chuẩn này giúp tìm ra mức độ cân bằng phù hợp giữa GPU/khối lượng xử lý và thiết kế/cài đặt mạng. Khi hài lòng với kết quả, đội ngũ kiến trúc sư máy tính và kỹ sư mạng có thể áp dụng các thiết lập này vào sản xuất và đo kết quả mới.
Các phòng thí nghiệm nghiên cứu của doanh nghiệp, các viện nghiên cứu và trường đại học đang nỗ lực phân tích mọi khía cạnh của việc xây dựng và vận hành các mạng AI hiệu quả để giải quyết những thách thức khi làm việc trên các mạng lớn, đặc biệt là khi các phương thức thực hành tốt nhất liên tục thay đổi. Phương pháp hợp tác có thể lặp lại này là cách duy nhất để các doanh nghiệp thực hiện các phép đo kiểm khả lặp và thử nghiệm nhanh các kịch bản "nếu - thì" - là nền tảng trong việc tối ưu hóa các mạng lưới phục vụ AI.
(Nguồn: Keysight Technologies)
(责任编辑:Thể thao)
- Nhận định, soi kèo Al
- Quỳnh Kool tủi thân phát khóc vì bị xúc phạm danh dự
- Vì sao các MC đua nhau tự tử?
- Nhận định, soi kèo U19 Tây Nguyên vs U19 Khánh Hòa, 14h30 ngày 9/1: Không thể có niềm vui
- Soi kèo phạt góc Genoa vs Monza, 02h45 ngày 28/01
- Soi kèo góc Club Leon vs Guadalajara, 10h00 ngày 29/1
- Lộ diện dàn 6 huấn luyện viên Giọng hát Việt nhí 2018
- Nhận định, soi kèo U19 Hoàng Anh Gia Lai vs U19 Quảng Ngãi, 15h00 ngày 9/1: Sáng kèo dưới
- Phạm Phương Thảo: 'Cả đời chỉ có một người đàn ông thì chán lắm!'
- Nhận định, soi kèo Club Leon vs Juarez, 06h00 ngày 26/01: Điểm tựa sân nhà
- Tổng đạo diễn Táo quân 2015 nói gì về việc bị tuýt còi?
- Về nhà đi con tập 55: Thư lộ rõ tình cảm dành cho Vũ
- Lộ diện dàn 6 huấn luyện viên Giọng hát Việt nhí 2018
-
Nhận định, soi kèo Burnley vs Leeds United, 3h00 ngày 28/1: Khó thắng
Chiểu Sương - 27/01/2025 01:57 Nhận định bóng ...[详细] -
Mê cung tập 4: Sát nhân biến thái định bắt cóc em gái cảnh sát
Trong tập 3 "Mê cung" phát sóng tối 1/5, nhân vật Fedora (Doãn Quốc Đam) tiếp tục lộ diện là một tội ...[详细] -
Nhận định, soi kèo U19 Hoàng Anh Gia Lai vs U19 Quảng Ngãi, 15h00 ngày 9/1: Sáng kèo dưới
Hồng Quân - 08/01/2025 17:40 Việt Nam ...[详细] -
Mê cung tập 4: Sát nhân biến thái định bắt cóc em gái cảnh sát
Trong tập 3 "Mê cung" phát sóng tối 1/5, nhân vật Fedora (Doãn Quốc Đam) tiếp tục lộ diện là một tội ...[详细] -
Nhận định, soi kèo Guadalajara vs Tigres UANL, 08h05 ngày 26/1: Duy trì mạch thắng và dẫn đầu
Linh Lê - 24/01/2025 22:24 Mexico ...[详细] -
Nhận định, soi kèo U19 Hoàng Anh Gia Lai vs U19 Quảng Ngãi, 15h00 ngày 9/1: Sáng kèo dưới
Hồng Quân - 08/01/2025 17:40 Việt Nam ...[详细] -
Diễn viên Việt Trinh lần đầu ngồi ghế nóng
– Nữ diễn kỳ cựu sẽ ngồi cạnh một loạt những cái tên quen thuộc ở vị trí giám khảo như nhạc sĩ Đức H ...[详细] -
Gương mặt thân quen tập 1: Đàm Vĩnh Hưng bái phục tài bắt chước của Hùng Thuận
- Giả giọng NSND Trần Hiếu, Hùng Thuận khiến Đàm Vĩnh Hưng thán phục vì sự tinh tế trong tiết mục dự ...[详细] -
Nhận định, soi kèo Nantes vs Lyon, 23h15 ngày 26/1: Phong độ sa sút
Chiểu Sương - 26/01/2025 02:07 Pháp ...[详细] -
Nhã Phương chia tay Trường Giang không lý do
Trong phim '49 ngày', nữ diễnviên 'Tuổi Thanh Xuân' vào vai bạn gái của Trường Giang. Tuy nhiên, việ ...[详细]
Nhận định, soi kèo Hoffenheim vs Eintracht Frankfurt, 21h30 ngày 26/1: Tin vào chủ nhà
Lộ diện dàn 6 huấn luyện viên Giọng hát Việt nhí 2018
- Nhận định, soi kèo Mohun Bagan vs Bengaluru FC, 21h00 ngày 27/1: Tin vào cửa trên
- Phim cuối cùng của Lê Bình về chủ đề cờ bạc bịp chuẩn bị ra rạp
- Về nhà đi con xuất hiện diễn viên 19 tuổi hot hơn cả Bảo Thanh, Thu Quỳnh
- Nhận định, soi kèo Bilbao vs Barcelona, 2h00 ngày 9/1: Thể hiện đẳng cấp
- Nhận định, soi kèo Zamalek vs El Gouna, 22h00 ngày 27/1: Trở lại mạch thắng lợi
- Công Lý lần đầu kể chuyện bị đánh trong 'Ơn giời, cậu đây rồi'
- Vì sao các MC đua nhau tự tử?