Zhang Haixiao, nhà quản lý quỹ cổ phần tại Yongyingfund, cho biết trong một lần xuất hiện gần đây trên chương trình “Chief Connection” của The Paper rằng “siêu chu kỳ” bán dẫn hiện tại về bản chất khác với các chu kỳ trước do sự thay đổi nguồn cầu từ sản xuất AI thay vì các yếu tố do tồn kho chi phối. Theo Zhang, nhu cầu ở hạ nguồn không hề giảm dù giá tăng; thay vào đó, chi tiêu vốn vẫn tiếp tục tăng, và ngay cả khi giá token tăng thì cũng không làm suy giảm nhu cầu, tạo nên một chuỗi truyền dẫn “mượt” trong toàn ngành.
Zhang lần theo diễn tiến nhu cầu rõ ràng bắt đầu từ thời điểm ChatGPT ra mắt vào cuối năm 2022. Ban đầu, nhu cầu phần cứng tập trung vào các điểm đầu huấn luyện theo đuổi hiệu năng cực hạn, trong đó bộ nhớ băng thông cao (HBM) lần đầu tiên được ứng dụng trên quy mô lớn. Khi các mô hình đưa ra các khuôn mẫu mới như suy luận theo chuỗi (chain-of-thought) và mở rộng ngữ cảnh để cải thiện kết quả, nhu cầu chuyển dịch sang các điểm đầu suy luận, nơi lượng tiêu thụ token tăng trưởng hai chữ số theo năm.
Vào nửa cuối năm 2025, các AI Agents có khả năng tự gọi công cụ và hoàn thành các tác vụ phức tạp từ khái niệm dần trở thành hiện thực, qua đó làm tăng thêm sự phụ thuộc vào bộ nhớ lưu trữ. Dựa trên chuỗi bùng nổ nhu cầu này, Zhang kết luận: “Điểm khởi đầu của đợt tăng giá chip lưu trữ lần này là Q3 2025.” Ông cho rằng sự đảo chiều của khoảng cách cung-cầu hoàn toàn đến từ tăng trưởng bùng nổ ở phía cầu hạ nguồn, nhận định này được củng cố bởi các công bố tài chính doanh nghiệp gần đây cho thấy lợi nhuận mạnh từ mảng phần cứng AI, đặc biệt trong các sản phẩm thuộc nhóm tăng giá chip lưu trữ.
Zhang nhấn mạnh rằng “siêu chu kỳ” hiện tại về bản chất khác với chu kỳ 2019-2021, trong đó khác biệt cấu trúc quan trọng nhất là sự thay đổi nền tảng về đặc tính nhu cầu. Giai đoạn 2019-2021 là một chu kỳ điển hình do tồn kho dẫn dắt: tăng trưởng nhu cầu đầu cuối chủ yếu đến từ nhu cầu thiết bị làm việc tại nhà (work-from-home) và các gián đoạn chuỗi cung ứng kích hoạt hành vi mua tích trữ. Vì vậy, sau giữa năm 2022, ngành nhanh chóng rơi vào “tình thế xả tồn kho và giá chip giảm nhanh”.
“Đợt cầu này xuất phát từ các điểm đầu tạo ra AI,” Zhang nói. “Hạ nguồn không giảm mua do tăng giá; thay vào đó, chi tiêu vốn vẫn tiếp tục tăng. Ngay cả khi giá token tăng cũng không thể kìm nén nhu cầu, và toàn bộ chuỗi truyền dẫn cực kỳ trơn tru.” Ông cũng cho biết chi tiêu vốn cho AI toàn cầu dự kiến đạt 700 tỷ USD vào năm 2026, và con số này vẫn tiếp tục được điều chỉnh tăng.
Song song đó, việc siết ở phía cung đã khuếch đại đáng kể khoảng cách cung-cầu. Các nhà cung cấp lưu trữ lớn dự kiến tăng chi tiêu vốn khoảng 50% vào năm 2026, nhưng thời gian trễ giữa đầu tư vốn và hình thành cung hiệu quả là rất lớn. Hơn nữa, nguồn vốn mới chủ yếu hướng tới bộ nhớ lưu trữ hiệu năng cao cho riêng AI, trong khi các hạng mục bổ sung năng lực lưu trữ thông thường vẫn đang chờ đợt ra mắt tiếp theo.
Zhang tách lợi ích chuỗi ngành thành hai nhánh: nhánh đầu tiên là chuỗi bán hàng của các nhà sản xuất thiết bị gốc (OEM), nhà sản xuất module và doanh nghiệp thiết kế, nơi sự thịnh vượng xuất hiện trước—đã được kiểm chứng bằng các báo cáo tài chính gần đây; nhánh thứ hai là chuỗi mở rộng của thiết bị, vật liệu và xây dựng cơ sở hạ tầng, nơi sự lan tỏa thịnh vượng diễn ra với độ trễ tương đối theo một tiến trình tăng dần.
Đáng chú ý, lập trường thận trọng của các OEM thượng nguồn đối với cung được phản ánh qua các điều chỉnh chiến lược. Zhang tiết lộ rằng: “Các OEM thượng nguồn, với tư cách doanh nghiệp thâm dụng vốn và lo ngại nhu cầu trong tương lai không đạt kỳ vọng, gây thua lỗ, đang chủ động ký các thỏa thuận cung cấp dài hạn (LTA) với khách hàng để chốt nhu cầu trong tương lai.”
Sự tiến hóa kiến trúc công nghệ đang làm thay đổi thứ bậc giá trị phần cứng. Zhang giải thích sự thay đổi này bằng “nguyên lý cái thùng”: theo kiến trúc Von Neumann, điện toán, bộ nhớ lưu trữ và liên lạc đầu vào-đầu ra là ba chức năng cốt lõi, trong đó mỗi giai đoạn sẽ có một yếu tố trở thành nút thắt hiệu năng. Năm 2023, năng lực điện toán là ràng buộc rõ ràng, nhưng khi nhu cầu ở các điểm đầu suy luận bùng nổ, nút thắt nhanh chóng chuyển sang phía lưu trữ.
Chu kỳ lặp lại phần cứng đang tăng tốc. Trước năm 2022, HBM thường được cập nhật mỗi 3-4 năm; từ năm 2023, chu kỳ này nén lại thành “nâng cấp 2 năm”. Xu hướng tăng tốc này cũng xuất hiện ở chip điện toán và chip truyền thông. Đồng thời, sự tiến hóa kiến trúc điện toán đang kéo CPU quay trở lại vị trí trung tâm. Zhang dẫn động thái ngành cho thấy tỷ lệ GPU-to-CPU trong tương lai có thể chuyển từ mức hiện tại 8:1 xuống 4:1, rồi tiến tới 2:1 hoặc thậm chí 1:1, qua đó trực tiếp thúc đẩy nhu cầu bộ nhớ tăng lên và đặt ra yêu cầu tốc độ truyền cao hơn cho các chip bộ nhớ và chip giao diện—những lần nâng cấp sẽ tiếp tục đẩy giá bán đơn vị sản phẩm tăng.
Ngoài việc đồng bộ theo chu kỳ toàn cầu, tiến bộ của bán dẫn nội địa là một trọng tâm đầu tư then chốt khác. Zhang cho biết các OEM thượng nguồn chip lưu trữ trong nước đã đạt tiến bộ đáng kể, thị phần tăng từ con số 0 lên khoảng 10%, trở thành một lực lượng không thể phủ nhận trong ngành. “Năng lực OEM được cải thiện sẽ thúc đẩy phát triển ở các mảng thiết kế hạ nguồn giữa và các lĩnh vực thiết bị, vật liệu thượng nguồn. Mỗi lần chuyển giao trong lịch sử ngành lưu trữ toàn cầu đều mang theo nâng cấp toàn diện chuỗi cung ứng tại các khu vực trong nước, và lần này sẽ không ngoại lệ. Tuy nhiên, đây chắc chắn là một quá trình dài hạn, không phải thứ có thể làm xong trong một sớm một chiều.”
Về rủi ro tiềm ẩn, Zhang xác định các biến số cốt lõi ở cả hai phía cung và cầu. Ở phía cung, việc theo dõi thời điểm giải phóng năng lực sản xuất là then chốt: các nhà sản xuất sẽ tối ưu hóa tối đa năng lực hiện có trước, sau đó lắp thêm thiết bị trong các cơ sở hiện hữu (thường cần 6-12 tháng để cho ra sản lượng thực), tiếp theo là xây dựng cơ sở mới (thường cần 2-3 năm để năng lực hiệu quả hình thành). Ông cảnh báo: “Việc giải phóng năng lực lớn dự kiến tập trung trong hai năm tới, do đó cần theo dõi liên tục liệu tốc độ giải phóng có vượt kỳ vọng hay không.”
Ở phía cầu, cần tập trung vào tốc độ chi tiêu vốn cho AI và các phát triển công nghệ. Zhang kết luận: “Chi tiêu vốn cho AI là chỉ báo theo dõi trực tiếp nhất, trong khi các công nghệ mới mở ra hoàn toàn các không gian thị trường mới, qua đó ảnh hưởng đến dự báo chi tiêu vốn của các nhà sản xuất mô hình và các tập đoàn công nghệ internet—tất cả đều cần quan sát liên tục.”
Tin tức liên quan
Dòng thanh khoản tăng vọt thúc đẩy sự lạc quan cho thị trường crypto
Dòng thanh khoản tăng mạnh thúc đẩy sự lạc quan trên thị trường tiền mã hóa
3 Crypto bứt phá cần theo dõi để có mức tăng lớn — ARKM, PYTH và SEI
Cựu người đoạt Nobel Spence: AI có thể thúc đẩy năng suất, nhưng không thể giải quyết khủng hoảng tăng trưởng
Raoul Pal: Cuộc đua AI Mỹ-Trung năm 2026 là một cuộc chiến mà không ai có thể giành chiến thắng