AI chips-hardware-compute

View All

Semi-Cloud-DC-Green AI chips-hardware-compute 2025-08-25 06:39:56

Meta chi 10 tỷ USD xây siêu trung tâm dữ liệu AI tại Louisiana, tiêu thụ điện gấp đôi bang New Orleans

Meta đang đầu tư 10 tỷ USD xây dựng trung tâm dữ liệu lớn nhất từ trước đến nay tại Richland Parish, Louisiana – một vùng nông thôn nghèo, nơi 1/4 dân số sống dưới mức nghèo.
Dự án có tên Hyperion, gồm 9 toà nhà chiếm diện tích hơn 4 triệu ft² (371.612 m² ~ 37 ha) – lớn hơn cả Disneyland – và có thể tiêu thụ điện tương đương 4 triệu hộ gia đình.
Mark Zuckerberg gọi đây là bước đi chiến lược để theo đuổi “siêu trí tuệ” (superintelligence), bù đắp cho thất bại của Metaverse và đẩy nhanh cuộc đua với Google, Amazon, OpenAI.
Dự án ban đầu tiêu thụ 2 gigawatt, có thể mở rộng đến 5 gigawatt – tương đương với 2–3 lần tổng nhu cầu điện của New Orleans.
Để cung cấp điện, Entergy sẽ xây dựng 3 nhà máy điện khí mới với tổng công suất 2.3 GW – lần đầu tiên trong hàng thập kỷ có dự án xây nhà máy mới ở khu vực này.
Meta sẽ thanh toán chi phí điện trong 15 năm đầu và cam kết xây dựng 1.5 GW năng lượng mặt trời và pin lưu trữ – giúp dự án được Sierra Club ủng hộ, nhưng vẫn bị nhiều nhóm môi trường khác phản đối.
Dự án Hyperion trở thành mô hình mẫu quốc gia cho quan hệ hợp tác giữa Big Tech và ngành năng lượng – theo đánh giá của các nhà điều hành và chuyên gia.
Tuy nhiên, lo ngại ngày càng lớn:
- Dự án chiếm đất nông nghiệp và nguồn nước, ảnh hưởng đến sinh kế nông dân.
- Chi phí điện cho người dân có thể tăng nếu Meta rút lui sớm hoặc nhu cầu không thực sự cần đến 2.3 GW.
- Luật mới ở Louisiana cho phép đếm điện khí là “năng lượng xanh”, gây tranh cãi về tiêu chuẩn môi trường.
Với nhu cầu AI tăng vọt, báo cáo Bộ Năng lượng Mỹ dự đoán tiêu thụ điện của các trung tâm dữ liệu có thể chiếm đến 12% điện toàn quốc vào 2028.
Trong năm nay, Amazon, Google, Microsoft mỗi hãng dự kiến đầu tư 75–100 tỷ USD cho hạ tầng dữ liệu AI, trong khi riêng Meta sẽ tăng từ 28 tỷ USD (2024) lên 70 tỷ USD năm nay, và tiếp tục tăng mạnh vào 2026.
Dự án cũng tạo ra căng thẳng giữa các nhóm lợi ích địa phương: người dân lo ngại lũ lụt, ô nhiễm, thiếu nước, trong khi các công ty dầu khí như Exxon và Shell phản đối vì sợ giá điện tăng cho nhà máy lọc dầu.
Tuy chưa đi vào hoạt động đến năm 2030, Meta đã định hình lại cục diện năng lượng quốc gia – với hàng loạt bang khác bắt đầu sao chép mô hình hợp tác điện khí + siêu máy tính AI.

📌 Meta gây chấn động khi xây Hyperion – siêu trung tâm dữ liệu trị giá 10 tỷ USD tại Louisiana, tiêu thụ điện gấp 2 lần New Orleans, mở đường cho cuộc đua AI siêu trí tuệ. Hyperion gồm 9 toà nhà chiếm diện tích hơn xấp xỉ 37 hecta. Entergy sẽ xây dựng 3 nhà máy điện khí mới với tổng công suất 2,3 GW – lần đầu tiên trong hàng thập kỷ có dự án xây nhà máy mới ở khu vực này. Meta sẽ thanh toán chi phí điện trong 15 năm đầu và cam kết xây dựng 1,5 GW năng lượng mặt trời và pin lưu trữ. Dự án Hyperion trở thành mô hình mẫu quốc gia cho quan hệ hợp tác giữa Big Tech và ngành năng lượng tuy nhiên vấp phải chỉ trích về môi trường, chi phí điện và rủi ro lạm phát hạ tầng không cần thiết.

https://fortune.com/2025/08/24/meta-data-center-rural-louisiana-framework-ai-power-boom/

Meta is sinking $10 billion into rural Louisiana to build the home of its wildest AI aspirations, setting the template for the nation’s grid buildout
By Delaney Nolan
August 24, 2025, 6:00 AM EDT
The rendering of Meta's planned data center complex in Richland Parish shows a massive arrive of facilities to power the AI boom.
The rendering of Meta's planned data center complex in Richland Parish shows a massive arrive of facilities to power the AI boom.
Meta
On a quiet patch of former farmland in northeastern Louisiana, a fleet of excavators has leveled more than 2,000 acres of reddish clay earth. This is rural Richland Parish, once a floodplain tangled with meandering bayous and wild canebrake where black bears still wander and a quarter of the 20,000 residents live below the poverty line.
Recommended Video
Enter Meta—the sixth-largest company in the world by market cap. The tech giant is keen on making Richland home to its wildest AI aspirations—courtesy of a tremendous amount of new gas-fired power. The region has ample land and sits adjacent to Louisiana’s huge Haynesville Shale gas field.
In December, construction began on Meta’s biggest-yet data center: a $10 billion complex of nine buildings, housing bank upon bank of servers that will take up over 4 million square feet, an area larger than Disneyland.
Meta chairman and CEO Mark Zuckerberg isn’t stopping there. He dubbed the project “Hyperion” in July—a data center “supercluster” that eventually could use the energy equivalent of 4 million homes and become the world’s biggest data center project. Zuckerberg said Hyperion would cover a “significant part of the footprint of Manhattan.”
The project entails more than 2 gigawatts of computing capacity—Zuckerberg said it could eventually expand to 5 gigawatts—programmed to train open-source large language models. Meta lagged in the AI race with previous flops and the multibillion-dollar “Metaverse” boondoggle. Now he’s framing Hyperion and his construction spree as the pursuit of “superintelligence,” while poaching AI talent using $250 million pay packages and buying a 49% stake in Scale AI.
It’s the latest in a grandiose game of Big Tech one-upmanship in AI, competing with the likes of Google, Microsoft, Amazon, and OpenAI.
“We are making all these investments because we have conviction that superintelligence is going to improve every aspect of what we do,” Zuckerberg said in Meta’s July 30 earnings call. A Meta spokesperson told Fortune it’s impossible to say exactly what the complex will power since it’s unclear how AI will have evolved when it opens in 2030.
The sheer size has left locals in this quiet region stunned.
“I think, like a lot of people, my initial reaction was kind of blown away that a site [so] rural was selected for something like that,” said Justin Clark, pastor of First Baptist Church in nearby Rayville. “As we started learning more about what it was and what the scope entailed, that feeling just continued. An amazement of, ‘Good grief.’”
Clark looks forward to welcoming new workers to the area but admits it’s difficult to truly visualize the scope. At a recent chamber of commerce banquet, they were told it’s the largest construction site in North America: “That’s unbelievable,” he marveled.
Altogether, Big Tech’s new data centers will be incredibly energy and water hungry. Keeping the Hyperion servers cool and functional will require twice the power of New Orleans—and eventually more.
As AI’s boom shifts into ever-higher gears, speculation abounds about how utilities will quench Big Tech’s deepening thirst for electricity. In the case of Meta (22 on the Fortune 500), regional utility Entergy will build three new gas-fired turbines with a combined capacity of 2.3 gigawatts—the first such buildout in decades—sparking pushback from ratepayers worried about consumer costs and from climate advocates who fear a backslide from green energy goals.
The scramble for AI dominance has positioned utilities as the gatekeepers of the hyperscaler market, weighing the benefits of massive capital investments for an emergent industry—whose future payoffs remain murky—versus potential rate hikes and the risk of stranded assets for decades to come.
State regulators gave Entergy the green light Aug. 20—two months earlier than expected—potentially setting the template for future deals between utilities and Big Tech to build new power plants, increasingly in more rural locales with affordable land. Entergy and regulators called the deal a model for the nation’s data center and power proliferation.
“This deal could signal to other states that this is how data centers should be governed and operated,” Louisiana Public Service Commissioner Davante Lewis told Fortune. “This would be a test across the nation. I’ve heard that from investors; I’ve heard that from credit agencies; I’ve heard that from fellow data centers—whatever comes out of the Meta deal may be the framework for them all.”
Meta is leveling the massive site for its data center complex in Richland Parish, Louisiana.
Meta is leveling the massive site for its data center complex in Richland Parish, Louisiana.
Meta
Meta’s Hyperion as the template
Hyperion has plenty of local political support, but it also managed to unite some environmentalists and Big Oil in opposition, the latter of which voiced concerns about increased power costs for their refineries and petrochemical plants.
“We’re not naive to the fact that it is a complex situation,” said Clark, noting conflicting local loyalties. “Some people who’ve lived in that area for generations feel displaced because of the development. At the same time, we don’t have any real say on whether it’s going to happen.”
The Louisiana Energy Users Group—including Exxon Mobil, Chevron, and Shell—said the project increases Entergy’s Louisiana energy demand by 30%, creating unprecedented financial risks to existing utility ratepayers.
Regardless, Entergy (No. 355 on the Fortune 500) now has the official go-ahead for its gas plants from the Public Service Commission (PSC), the five-person elected body that regulates utilities in the state. Lewis was the only one to vote in opposition. The hearing raised the same questions looming over the nation: How much energy is enough? Can states risk turning down massive economic development investments? And, after the advent of China’s DeepSeek—proving AI can become cheaper and more efficient—could the stampede for power be built on a bubble?
The country already counts about 3,800 data centers—many built during the earlier cloud-computing boom—with the biggest chunk concentrated in Virginia’s so-called Data Center Alley, where 500 facilities find easy access to fiber-optic connectivity for high transfer speeds. But most of those are relatively small compared to what’s needed to power AI. This year alone, hyperscalers announced hundreds of billions of dollars to feed the growing generative AI needs.
Amazon, Google, and Microsoft are investing anywhere from $75 billion to $100 billion each into building data centers in 2025—numbers that would have strained the imagination of any economist just a couple of years ago. Meta’s data center budget is about $70 billion—way up from $28 billion last year—and expected to “ramp significantly” more in 2026 as part of Meta’s “massive bet” on superintelligence, Zuckerberg said.
These projects depend on an astonishing amount of new power. A recent report from the U.S. Department of Energy estimates data centers’ grid needs could triple by 2028, consuming up to 12% of the nation’s electricity. OpenAI’s Stargate received an upfront investment of $100 billion in January for the $500 billion data center complex proposed in Texas, where more than 100 new gas plants are proposed to power it and other projects—though many will never come to fruition. Still, industry research group Enverus projects the next five years will bring roughly 46 gigawatts of gas-fired electricity online, a 20% jump in new construction.
Experts agree some surge in electric capacity nationwide is needed. It’s the exact extent that’s unknown, said Cathy Kunkel, energy analyst for the Institute for Energy Economics and Financial Analysis.
Electricity demand in the U.S. held steady for 15 years but, last year, it increased by 3%— marking the fifth-highest rise this century. More jumps are projected for years to come.
Meta’s and Entergy’s plans to meet that demand are “precedent setting,” Kunkel said.
Buoyed by the Meta project, Entergy’s stock has hit record highs. Meta, meanwhile, has taken on a significant chunk of the upfront costs in Richland.
According to the contract, Meta will pay the power costs for the $3.2 billion gas plants for the first 15 years—more than the typical 10-year contract, but not as much as the 25 years critics sought—as well as some transmission costs. Meta also committed to help build 1.5 gigawatts of solar and battery power throughout Louisiana, eventually winning the support of the Sierra Club, but not other environmental groups.
The arrangements could signal to the market this is the “new gold standard,” Lewis said. That’s a red flag for opponents.
“The problem here is that this is going to set precedent,” Logan Burke, of the Alliance for Affordable Energy, testified Aug. 20. “This settlement puts all of us, all of your constituents and customers in the state, at the mercy of a non-public contract between two corporations.”
Map locates data centers in development and gas plants to provide the power.
Data centers and gas plants are booming in Virginia, Texas, California, and, increasingly, nationwide, including more rural locales.
Fortune
Risks of overbuilding or fears of shortages?
The staggering scale of the project and the resource demands it entails have raised alarm bells for some in Louisiana, where the electric grid is already fragile.
In May, over 100,000 south Louisiana customers lost power after demand outstripped supply.
“The Richland data center is to be the largest in the world,” said Margie Vicknair-Pray, coordinator with the Sierra Club’s Louisiana chapter that broke with the national group’s support. “How can we ensure that blackouts won’t become more frequent? What we have yet to fully understand is the impact the data center will have on the land, our resources, and the people.”
While Meta has a non-binding promise to build more renewable energy, the Louisiana Legislature passed a new law that adds natural gas to the definition of green energy, allowing Zuckerberg and others to count Entergy’s gas turbines as “green.”
Gas-fired plants pose other hurdles. There’s a shortage of turbine manufacturing in the global supply chain. Gas turbines are essentially sold out for the next five years.
With the state bypassing the standard, lengthier review process, Lewis questions whether Entergy and Meta need extra turbines. “Why are we only focusing, quite frankly, on generation buildup?” he wondered, rather than grid efficiency and flexibility. He warned of Meta potentially walking away early, leaving ratepayers stuck with excess costs.
Entergy spokesman Brandon Scardigli told Fortune that “natural gas-fueled generation is the lowest reasonable cost option available that can support the 24/7 electrical demands of a large data center like Meta.”
The other wild card is the expectation for improvements in computing and power efficiency. Kunkel concluded an inevitability. The projects will use less energy, she said, “either because they get more efficient or because they don’t and go bankrupt.”
It could mean utilities—and Big Tech—find themselves pouring capital into new gas generation no one needs.
Meta shows its blue-hued cold storage facilities within its data centers.
Meta shows its blue-hued cold storage facilities within its data centers.
Meta
What and where else?
As huge data centers spread throughout rural locales nationwide, Vicknair-Pray questioned the impact of air and noise pollution on farmers and ranchers, and especially the massive water consumption that could impact their livelihoods.
“How will the water be shared?” she asked. “And what happens if the farmers are unable to water their crops?”
The nonpartisan think tank Energy Innovation proposes that hyperscalers invest primarily in renewable energy and battery storage developments, with some new gas-fired power used only as needed for backup.
Mike O’Boyle, senior director of electricity policy at Energy Innovation, believes building too many new gas turbines poses unnecessary risks. “I know the environment right now, federally and in the industry, is ‘Build, build, build,’ as fast as we can.” But costs must be considered. “We’re in a limited resource environment where supply is much lower than demand, and it’s causing prices to skyrocket.”
Beyond Virginia, data centers currently are concentrated in the biggest states, such as Texas and California. But part of what makes data centers attractive to developers is they open industrial development for economically depressed areas that aren’t near ports or airports—such as Richland Parish.
Adam Robinson, an energy analyst with Enverus, looked at where the buildout may head next. He said many factors are considered by developers: Power and land prices and availability, grid and fiber-optic connectivity, and the time it takes to connect to the grid.
Robinson predicts a lot of development in the PJM Interconnection (Pennsylvania-New Jersey-Maryland) region from New Jersey through the Rust Belt and into Illinois. The region is attracting hyperscalers thanks to competitive power markets, good connectivity, and high data-transfer speeds.
Developers looking for large plots of affordable land also are looking West, while co-location and smaller developers are more focused on cheap land and tax incentives in Texas and the Deep South, Robinson said. Louisiana, for instance, exempted the Meta deal from sales taxes.
Pastor Clark recognizes that tech progress is inevitable in Richland and everywhere else.
“It is happening,” he said, “so we want to make the best of it.”

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-08-24 06:49:52

Chip AI “Made in China” của DeepSeek đe dọa Nvidia và có thể làm rung chuyển thị trường crypto Mỹ

DeepSeek, công ty AI hàng đầu Trung Quốc, vừa công bố chip AI hoàn toàn do Trung Quốc tự thiết kế và sản xuất, đánh dấu bước tiến chiến lược trong việc giảm phụ thuộc vào chuỗi cung ứng quốc tế.
Mặc dù chip này chưa mạnh bằng Nvidia, nhưng ý nghĩa thực sự nằm ở việc mang lại cho Bắc Kinh sự độc lập công nghệ, đồng thời loại bỏ Nvidia khỏi thị trường Trung Quốc – một thị trường khổng lồ cho cả AI và khai thác tiền điện tử.
Nvidia vốn không chỉ dẫn đầu trong AI mà còn cung cấp GPU cho phần lớn hoạt động khai thác crypto toàn cầu. Do đó, sự suy yếu của Nvidia sẽ trực tiếp ảnh hưởng đến hạ tầng blockchain.
Nguyên nhân sâu xa bắt nguồn từ cuộc chiến thương mại Mỹ–Trung. Từ lệnh cấm xuất khẩu chip Nvidia sang Trung Quốc dưới thời Donald Trump, Bắc Kinh đã khuyến khích các công ty nội địa phát triển công nghệ thay thế, mở đường cho sự xuất hiện của chip DeepSeek.
Nếu Nvidia mất chỗ đứng ở Trung Quốc, công ty sẽ chịu thiệt hại kép: doanh thu sụt giảm mạnh và chuỗi cung ứng toàn cầu trở nên bất ổn, đe dọa các thợ đào coin vốn phụ thuộc nặng nề vào GPU.
Sự thay thế Nvidia bằng chip Trung Quốc có thể gây “hiệu ứng boomerang” cho thị trường tiền điện tử:
- Giảm nguồn cung GPU toàn cầu cho crypto mining.
- Gia tăng sự phụ thuộc vào công nghệ Trung Quốc – trong khi Trung Quốc vẫn giữ lập trường cứng rắn với crypto.
Triển vọng tương lai bất định:
- Nếu chip DeepSeek đủ mạnh, nó sẽ mở ra cuộc chiến công nghệ công khai với Nvidia.
- Nếu kém hơn, chỉ riêng đòn bẩy chính trị–kinh tế cũng đủ làm tái định hình bản đồ AI và crypto.
Đối với nhà đầu tư tiền điện tử, đây là tín hiệu rủi ro kép: Trung Quốc độc lập công nghệ nhưng cấm crypto, còn Nvidia suy yếu khiến hạ tầng khai thác toàn cầu thêm mong manh.

📌 DeepSeek, công ty AI hàng đầu Trung Quốc, vừa công bố chip AI hoàn toàn do Trung Quốc tự thiết kế và sản xuất, đánh dấu bước tiến chiến lược trong việc giảm phụ thuộc vào chuỗi cung ứng quốc tế. Đây không chỉ là thách thức với Nvidia mà còn đe dọa trực tiếp thị trường tiền điện tử Mỹ. Trong bối cảnh 75% hoạt động đào coin phụ thuộc GPU, sự sụt giảm nguồn cung do chiến tranh công nghệ Mỹ–Trung có thể khiến crypto đối mặt cú sốc mới. Trung Quốc thì cấm crypto nhưng lại kiểm soát công nghệ cốt lõi, khiến thị trường toàn cầu rơi vào thế bất ổn khó lường.

https://www.cointribune.com/en/the-us-crypto-market-in-danger-facing-deepseeks-new-ai-chip/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-08-22 23:12:16

Nvidia dừng sản xuất chip AI H20 cho Trung Quốc giữa lo ngại an ninh thông tin

Nvidia đã yêu cầu một số nhà cung cấp linh kiện tạm dừng sản xuất chip AI H20 được thiết kế riêng cho thị trường Trung Quốc, theo nguồn tin từ The Information.
Amkor Technology (Mỹ, Arizona) chịu trách nhiệm đóng gói tiên tiến cho chip, còn Samsung Electronics (Hàn Quốc) cung cấp bộ nhớ băng thông cao (HBM) cho H20. Cả hai công ty hiện chưa bình luận.
Người phát ngôn Nvidia khẳng định công ty luôn điều chỉnh chuỗi cung ứng theo điều kiện thị trường, đồng thời nhấn mạnh H20 không phải là sản phẩm quân sự và cũng không phục vụ hạ tầng chính phủ.
Phía Nvidia so sánh: cũng như Mỹ không dựa vào chip Trung Quốc cho vận hành chính phủ, Trung Quốc cũng không dùng chip Mỹ cho hạ tầng công.
Động thái này diễn ra sau khi chính quyền Trung Quốc tuần trước triệu tập nhiều doanh nghiệp lớn trong nước – gồm Tencent và ByteDance – để bày tỏ lo ngại về việc mua chip H20, đặc biệt liên quan đến rủi ro thông tin.
Chip H20 từng được Nvidia phát triển nhằm tuân thủ quy định kiểm soát xuất khẩu công nghệ của Mỹ, sau khi Washington siết chặt việc bán GPU AI cao cấp cho Trung Quốc.
Việc tạm ngừng sản xuất chip có thể ảnh hưởng tới nguồn cung AI cho các công ty công nghệ Trung Quốc vốn phụ thuộc vào Nvidia để huấn luyện và triển khai mô hình AI quy mô lớn.
Sự kiện phản ánh căng thẳng ngày càng gia tăng trong cuộc chiến công nghệ Mỹ - Trung, nơi bán dẫn và chip AI là mặt trận then chốt.
Tương lai của H20 vẫn chưa rõ ràng: có thể Nvidia sẽ điều chỉnh sản phẩm, hoặc Trung Quốc đẩy mạnh phát triển chip nội địa thay thế.

📌 Nvidia bất ngờ yêu cầu Amkor và Samsung dừng sản xuất chip H20 cho Trung Quốc. Động thái diễn ra ngay sau khi Bắc Kinh cảnh báo Tencent và ByteDance về rủi ro thông tin liên quan chip này. H20 vốn được phát triển để đáp ứng lệnh kiểm soát xuất khẩu của Mỹ, nhưng giờ trở thành điểm nóng mới trong căng thẳng công nghệ Mỹ - Trung.

https://www.reuters.com/world/china/nvidia-orders-suppliers-halt-work-china-focussed-h20-ai-chip-information-says-2025-08-22/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-08-22 23:02:11

Nhật Bản tung chiến lược bán dẫn mới với khoản đầu tư 27 tỷ USD, đưa Rapidus sản xuất chip 2nm thí điểm

Nhật Bản từng thống trị ngành bán dẫn thập niên 1980 với hơn 50% thị phần, nhưng tụt lại do xung đột thương mại Mỹ - Nhật và không kịp thích ứng với chuyên môn hóa sản xuất. Đến 2019, thị phần toàn cầu giảm dưới 10%.
Chính phủ coi đây là rủi ro an ninh quốc gia, nhất là sau đại dịch, chiến tranh Ukraine và lo ngại Trung Quốc với Đài Loan – nơi sản xuất phần lớn chip tiên tiến. Chiến lược an ninh 2022 nhấn mạnh phát triển bán dẫn thế hệ mới.
Từ 2020-2024, Nhật chi 3,9 nghìn tỷ yên (~27 tỷ USD) cho ngành bán dẫn, tỷ lệ GDP còn lớn hơn Mỹ trong CHIPS Act.
Rapidus (thành lập 2022) là trung tâm của nỗ lực này:
- 2024: mở fab tại Chitose, Hokkaido.
- 12/2024: mua hệ thống in thạch bản EUV đầu tiên từ ASML.
- 7/2025: sản xuất thử chip 2nm thành công.
- Được hỗ trợ 1,72 nghìn tỷ yên (~12 tỷ USD) và hợp tác công nghệ với IBM.
- Huy động vốn từ Sony, Toyota, SoftBank và nhiều tập đoàn lớn.
TSMC mở fab ở Kyushu (chip 12-28nm), dự định xây tiếp 2 nhà máy; Micron được trợ cấp hơn 1 tỷ USD để mở rộng tại Hiroshima; Samsung xây trung tâm R&D ở Yokohama. Kyushu được gọi là “Silicon Island”.
Thách thức Rapidus:
- Nhân lực: phải dựa vào kỹ sư lớn tuổi, trung bình trên 50; khoảng 150 kỹ sư được gửi sang IBM New York huấn luyện.
- Mô hình kinh doanh: không cạnh tranh trực tiếp TSMC mà hướng tới chip “boutique” – lô nhỏ, chuyên biệt, phục vụ AI tạo sinh và tối ưu điện năng.
- Sản xuất hàng loạt: mục tiêu 2027, cần duy trì chất lượng đồng nhất.
Nhật đặt cược lớn: nếu thành công, đây sẽ là sự hồi sinh của ngành bán dẫn và củng cố vị thế chiến lược toàn cầu.

📌 Nhật Bản đầu tư 27 tỷ USD để phục hưng ngành chip, với Rapidus sản xuất thử chip 2nm trong chưa đầy 3 năm thành lập. Chính phủ trợ cấp, IBM hỗ trợ công nghệ, các tập đoàn lớn góp vốn. Song thách thức còn lớn: thiếu nhân lực trẻ, mô hình kinh doanh khác biệt và mục tiêu sản xuất hàng loạt năm 2027. Nhật Bản đang nỗ lực trở lại bản đồ bán dẫn thế giới sau nhiều thập kỷ tụt dốc.

https://www.economist.com/asia/2025/08/21/japan-storms-back-into-the-chip-wars

Japan storms back into the chip wars
The country used to be a semiconductor powerhouse. Can it be one again?
Share
Illustration of Mount Fuji with a large red microchip rising behind it like the sun and lots of circuitry running around it
Illustration: Ben Hickey
Aug 21st 2025
|
Chitose
|
6 min read
KOIKE ATSUYOSHI likes to go fast. The 73-year-old semiconductor engineer is a motorcycle aficionado. He brings the same tempo to his latest company, Rapidus. Founded in 2022, the firm opened its massive semiconductor factory, or “fab”, last year in Chitose, a small city on Hokkaido, Japan’s northernmost main island. In December Rapidus became the first Japanese entity to acquire an extreme ultraviolet lithography (EUV) system from ASML, the Dutch company that makes the unique devices; Rapidus had the complex up and running within months. In mid-July, Mr Koike announced the successful pilot production of two-nanometre (2nm) transistors, the thinnest, most advanced chips yet. “A company that’s been around less than three years managed to do it,” he boasts. “It’s an incredible pace.”
Rapidus is the most ambitious element of a broader effort to revive the semiconductor industry in Japan. In the boldest industrial policy push in a generation, the Japanese government ploughed ¥3.9trn ($27bn) into support for semiconductors between early 2020 and early 2024. As a share of GDP, that amounts to a bigger commitment than America made to its semiconductor industry through the CHIPS Act. Japan wants both to revive its domestic champions and to attract foreign ones, such as TSMC, the Taiwanese semiconductor giant, which now makes chips in southern Japan. At the launch of its fab there last year, Morris Chang, the TSMC founder, spoke of a chip “renaissance”.
Japan once dominated the semiconductor industry. In the 1980s, Japanese firms accounted for more than half of the global market, and an even bigger share of the cutting-edge chips of the time. But trade friction with America led to limits on Japanese chip exports, creating an opportunity for rivals in Taiwan and South Korea. Japanese companies also struggled to shift to an era of increasing specialisation in semiconductor production. Whereas some Japanese firms retained strong positions in the materials and equipment necessary for making semiconductors, from coating chemicals to silicon wafers themselves, they fell behind in cutting-edge manufacturing. By 2019, Japan accounted for less than 10% of the world’s semiconductors.
The Japanese government came to see this state of affairs not only as a commercial disaster, but also as a national-security risk. Supply-chain disruptions during the pandemic helped raise public awareness of the crucial role chips play in modern life. The war in Ukraine fuelled fears of Chinese designs on Taiwan—and highlighted the risk of depending on a single firm there for most of the world’s high-end chips. The emergence of generative artificial intelligence (AI) has only heightened the strategic importance of semiconductors. Japan’s latest National Security Strategy, released in 2022, explicitly sets a goal of strengthening “next-generation semiconductor development and manufacturing bases”.
Japan’s semiconductor strategy consists of two main pillars. First is indispensability, which means, in effect, “being influential over others”, says Mireya Solís of the Brookings Institution, an American think-tank. The idea is that if Japan can control parts of a long supply chain it can leverage that interdependence to keep others (ie, China) from weaponising their control over certain inputs.
The second pillar is autonomy, or having domestic production capacity. “The world will be divided into two groups: countries that can supply semiconductors and countries that buy them,” says Amari Akira, a former lawmaker with the ruling Liberal Democratic Party (LDP) who led semiconductor policy. “The countries that supply will be the winners, and the countries that buy will be the losers.”
The government has refreshed its industrial-policy toolkit to meet the challenge. The LDP passed a series of new laws in recent years enabling broader and longer-lasting government support for chip firms like Rapidus. While such measures involve taking sizable bets with taxpayer money, they have broad political support. “Of course there are risks involved—but there are also risks of doing nothing,” says one LDP bigwig involved in the policies.
The measures have begun to bear fruit. Big subsidies helped entice TSMC to set up shop in Kyushu. Its first fab there produces chips of 12-28nm—the most advanced type of semiconductor to be produced in Japan so far, but still well behind its state-of-the-art models. The firm has already announced plans to build a second facility for even higher-end logic chips there; talks about a potential third fab are reportedly under way. TSMC’s arrival has enticed suppliers and partners to expand on Kyushu, which has positioned itself as “Silicon Island”.
Micron, an American memory chipmaker, has also received more than $1bn in subsidies to expand its chipmaking facilities in Hiroshima. Meanwhile Samsung, a South Korean electronics giant, is building a cutting-edge research facility in Yokohama, south of Tokyo.
Another nascent ecosystem is emerging around Rapidus. The firm is the highest-risk and highest-reward bet of the bunch. Born of a partnership with IBM, which developed a new method for making next-generation transistors, a type of electrical component, Rapidus hopes to leapfrog across a generation of semiconductor engineering and catch up with global pace-setters. It has attracted investment from a consortium of eight blue-chip Japanese firms, including Sony, Toyota and SoftBank. The government has also bankrolled much of the initial cost, to the tune of ¥1.72trn ($12bn) through early 2025.
The success of Rapidus hinges on meeting three big challenges, says Ota Yasuhiko of Hokkaido University. First is cultivating enough talented cadres. Universities across Japan are launching programmes to train a new generation of semiconductor engineers. But in the meantime, Rapidus has had to rely largely on older specialists who came of age during Japan’s first chip boom; the average age of its recruits was initially over 50. Roughly 150 top engineers were sent to train at IBM’s research facility in New York.
Another challenge is developing a sustainable business model. Samsung and TSMC are advancing towards 2nm chips of their own, and have established relationships with the buyers of high-end semiconductors. Rapidus is positioning itself as a boutique option, able to make smaller lots of specialised chips, rather than large batches of one-size-fits-all offerings. “We have no intention of directly competing with TSMC—the markets are different,” Mr Koike says. He is counting on generative AI becoming a tailwind, boosting overall demand for chips and increasing interest in offerings that can improve efficiency and reduce power consumption.
But first Rapidus must make the leap to mass production, which the firm aims to begin in 2027. While the successful pilot wafer is an encouraging sign, the true test will be whether Rapidus can make lots of them of the quality necessary to be commercially viable. The production process for such semiconductors is closer to handmade crafts than to assembly-line widgets: engineers must constantly adjust equipment to maintain correct parameters. For Mr Koike, motorcycles offer another lesson here. A lifetime of riding, he says, has taught him “about how a machine and a human being can work together closely”. Japan’s chip renaissance depends on it. ■

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute AI pháp lý-quản trị-chủ quyền 2025-08-21 23:11:45

Trung Quốc đặt mục tiêu tự chủ 70% chip AI vào năm 2027 để thoát phụ thuộc Nvidia

Các thành phố lớn của Trung Quốc như Thượng Hải, Bắc Kinh và Quý Dương đang thực hiện các kế hoạch cụ thể nhằm đạt ít nhất 70% tự chủ về chip AI vào năm 2027, với Bắc Kinh đặt mục tiêu đạt 100%.
Thượng Hải nhắm đến việc kiểm soát độc lập 70% lượng chip sử dụng trong các trung tâm dữ liệu, nghĩa là các chip phải được thiết kế hoặc sản xuất bởi doanh nghiệp Trung Quốc.
Quý Dương, nơi có nhiều trung tâm dữ liệu lớn (bao gồm của Apple), yêu cầu 90% chip cho các trung tâm mới phải là hàng sản xuất nội địa.
Chủ tịch Tập Cận Bình khẳng định tại một hội nghị tháng 4/2025 rằng Trung Quốc cần tận dụng hệ thống huy động nguồn lực quốc gia để đạt được tự chủ và sức mạnh trong công nghệ AI.
Dù các công ty như DeepSeek, Alibaba, và Baidu đang phát triển AI, nhưng đến đầu năm 2024, Nvidia vẫn chiếm 80% thị phần chip AI tại Trung Quốc, theo báo cáo từ Shanxi Securities.
Huawei đã phát triển dòng chip Ascend 910, trong đó mẫu 910B đạt 85% hiệu suất của Nvidia H20. Chip Ascend 920 thế hệ tiếp theo được dự đoán sẽ vượt H20.
Huawei hợp tác với SMIC – nhà máy đúc chip lớn nhất Trung Quốc – để sản xuất, với trọng tâm là thu nhỏ quy trình sản xuất chip.
Các công ty khác như Cambricon Technologies và Kunlun (thuộc Baidu) cũng đang đẩy mạnh phát triển chip AI.
Shanxi Securities dự báo thị phần của Nvidia tại Trung Quốc sẽ giảm còn 50%-60% trong 5 năm tới, trong khi các đối thủ nội địa sẽ chiếm 40%-50%.
China Mobile đã chi 19,1 tỷ nhân dân tệ (~2,65 tỷ USD) mua máy chủ AI giai đoạn 2024–2025, toàn bộ dùng chip của Huawei.
ByteDance đang xem xét sử dụng chip Huawei. Các cơ quan nhà nước được khuyến cáo không sử dụng Nvidia H20, đặc biệt trong các lĩnh vực an ninh.
Dù chip nội địa còn yếu hơn về hiệu suất, khu vực công và các doanh nghiệp vẫn ưu tiên dùng sản phẩm trong nước để giảm rủi ro an ninh.
Tuy nhiên, vẫn còn khó khăn: một số mô hình AI của DeepSeek bị trì hoãn do dùng chip Huawei, theo các nguồn tin trong ngành.
Mỹ đã cho phép nối lại xuất khẩu Nvidia H20 sang Trung Quốc từ tháng 7/2025, cho thấy Trung Quốc vẫn giữ cân bằng giữa nhập khẩu công nghệ Mỹ và phát triển nội địa.

📌 Trung Quốc đặt mục tiêu đạt ít nhất 70% tự chủ chip AI vào năm 2027, với Bắc Kinh nhắm đến 100%. Huawei, Baidu và các công ty nội địa đang thay thế Nvidia dần dần, Huawei đã phát triển dòng chip Ascend 910, trong đó mẫu 910B đạt 85% hiệu suất của Nvidia H20. Chip Ascend 920 thế hệ tiếp theo được dự đoán sẽ vượt H20. Nvidia hiện chiếm 80% thị phần nhưng có thể giảm còn 50%-60% trong 5 năm tới. China Mobile đã chi khoảng 2,65 tỷ USD) mua máy chủ AI giai đoạn 2024–2025, toàn bộ dùng chip của Huawei.

https://asia.nikkei.com/business/technology/artificial-intelligence/chinese-cities-target-70-ai-chip-self-sufficiency-to-counter-nvidia

Chinese cities target 70% AI chip self-sufficiency to counter Nvidia
Municipalities follow Beijing's push to develop artificial intelligence industry
20250820N Huawei Shanghai
Huawei Technologies has developed AI chips as an alternative to Nvidia products. (Photo by Tomoko Wakasugi)
SHUNSUKE TABETA
August 21, 2025 01:12 JST
BEIJING -- Leading municipalities in China are seeking to achieve at least 70% self-sufficiency in artificial intelligence chips by 2027, looking to redraw a national supply chain dominated by U.S. leader Nvidia.
A Shanghai municipal government plan calls for China to be able to exercise independent control over 70% of the semiconductors used in data centers. The ratio is said to refer to semiconductors designed or manufactured by Chinese companies.
In Beijing, where many central government agencies are located, the municipality adopted a plan to increase the self-sufficiency ratio to 100% by 2027.
The inland city of Guiyang has requested that about 90% of the semiconductors used in data centers currently under construction be made in China. Guiyang is home to a large concentration of data centers, such as the one used by Apple.
The municipal push reflects the central government's policy.
"In the face of the rapid evolution of new-generation AI technologies, China must fully leverage the strengths of the new system for mobilizing the resources nationwide, [achieving] self-reliance and strength in this regard," President Xi Jinping said at an AI study session held by the Politburo in late April.
Xi indicated that the government will provide support for development and production of AI semiconductors.
China increasingly uses AI services provided by homegrown developers such as DeepSeek, Alibaba Group Holding and Baidu. But the country remains dependent on Nvidia for semiconductors. Nvidia held an 80% share in China's AI chip market at the start of 2024, China's Shanxi Securities reports.
Huawei Technologies developed the Ascend 910 series of AI chips to offer a Chinese-made alternative. The current flagship product, the 910B, has about 85% of the computing power of Nvidia's H20, a product designed for the Chinese markets, according to Chinese media.
The next-generation 920 chip is expected to have improved performance that can replace the H20, local media report.
The Ascend chips designed by Huawei are manufactured by companies such as Semiconductor Manufacturing International Corp., which is China's largest foundry and is backed by a government-affiliated fund. Developers are trying to advance miniaturization.
In addition to Huawei, Cambricon Technologies and Baidu subsidiary Kunlun are accelerating AI chip development.
Shanxi Securities projects Nvidia's market share in China will decline to 50%-60% within five years, while Chinese rivals grow to a combined 40%-50%.
State-owned telecom giant China Mobile decided to procure 19.1 billion yuan ($2.65 billion) worth of AI servers between 2024 and 2025, and all the chips in the servers were Huawei products, China Securities said.
China wants major private tech companies to switch to domestically produced chips. ByteDance, the Chinese parent of video-sharing platform TikTok, is reportedly considering adopting Huawei products.
Bloomberg reports that Chinese authorities have asked domestic companies not to use Nvidia's H20, urging in particular that the chip be avoided for government or national security work.
"There's an accelerating trend in the public sector and elsewhere to use products from Chinese companies, even if they are inferior in performance," a local government source said.
But breaking dependence on U.S. supplies will be difficult. The Financial Times has reported that DeepSeek's development of new AI models has been delayed. The report cites sources saying the delay was caused by the use of Huawei products, with the encouragement from Chinese authorities.
China has been asking Washington to ease restrictions on semiconductors. In July, the U.S. allowed a resumption of H20 exports to China.
Many think China will maintain a balance between Nvidia and domestic chips for the time being.
"In areas unrelated to economic security, China aims to absorb cutting-edge U.S. technology by continuing to import Nvidia and other products, while also improving the computing power of its AI," an expert on the semiconductor industry said.

Không có file đính kèm.

Nguồn tham khảo

Semi-Cloud-DC-Green AI chips-hardware-compute 2025-08-21 23:05:02

Năng lực trung tâm dữ liệu của Thái Lan dự kiến sẽ tăng gấp ba lần vào năm 2027 do nhu cầu AI

Công suất trung tâm dữ liệu của Thái Lan dự kiến sẽ tăng gấp ba, từ 350MW năm 2024 lên 1GW vào năm 2027, theo Hiệp hội Trung tâm Dữ liệu Thái Lan.
Tổng vốn đầu tư vào lĩnh vực này ước tính khoảng 6,5 tỷ USD với chi phí khoảng 10 triệu USD cho mỗi megawatt công suất trung tâm dữ liệu.
Các tập đoàn công nghệ lớn toàn cầu như Google (Alphabet), Amazon, Microsoft và Nvidia đang rót hàng tỷ USD vào cơ sở hạ tầng AI tại Thái Lan và khu vực Đông Nam Á.
Thái Lan nổi bật nhờ nguồn điện và nước ổn định, khiến quốc gia này trở thành điểm đến hấp dẫn cho việc mở rộng trung tâm dữ liệu.
Quốc gia này đang đẩy mạnh chuyển dịch từ vai trò trung tâm sản xuất ô tô và điện tử truyền thống sang lĩnh vực công nghệ cao, đặc biệt là AI và điện toán đám mây.
Chính phủ Thái Lan muốn thu hẹp khoảng cách với Malaysia và Singapore, những quốc gia dẫn đầu trong khu vực về trung tâm dữ liệu và dịch vụ đám mây.
Trong 6 tháng đầu năm 2025, Hội đồng Đầu tư Thái Lan (BOI) đã phê duyệt các đơn xin đầu tư trị giá 322 tỷ baht (khoảng 9,9 tỷ USD) cho 36 dự án công nghệ, phần lớn là trung tâm dữ liệu.
Hiện tại, Hiệp hội Trung tâm Dữ liệu Thái Lan đang chờ thông tin rõ ràng từ phía Mỹ liên quan đến kế hoạch hạn chế xuất khẩu chip AI, điều có thể ảnh hưởng đến ngành trung tâm dữ liệu trong nước.

📌 Năng lực trung tâm dữ liệu Thái Lan dự kiến tăng từ 350 MW lên 1 GW vào năm 2027, với khoản đầu tư 6,5 tỷ USD từ các ông lớn như Google, Amazon và Microsoft. Lý do chính là hạ tầng năng lượng ổn định và tham vọng bắt kịp Singapore, Malaysia trong lĩnh vực AI. 36 dự án công nghệ đã được phê duyệt nửa đầu năm 2025 với tổng vốn gần 10 tỷ USD. Thái Lan nổi bật nhờ nguồn điện và nước ổn định, khiến quốc gia này trở thành điểm đến hấp dẫn cho việc mở rộng trung tâm dữ liệu.

https://www.freemalaysiatoday.com/category/business/2025/08/20/thai-data-centre-capacity-may-triple-on-surging-demand-for-ai

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-08-21 18:08:42

Nvidia lao đao ở Trung Quốc, Nhật Bản khủng hoảng chip công suất trước sức ép từ Trung Quốc

Tình trạng thời tiết cực đoan tại Đài Loan và Hong Kong gây ảnh hưởng tới nông nghiệp, vận tải và chuỗi cung ứng chip. Đài Loan đang tranh luận về việc duy trì điện hạt nhân, với Pegatron ủng hộ mạnh mẽ để đảm bảo an ninh năng lượng phục vụ ngành chip và AI vốn tiêu thụ điện lớn.
Nvidia chịu sức ép tại Trung Quốc khi chip H20, phiên bản hạ cấp để tránh lệnh trừng phạt Mỹ, bị Bắc Kinh cảnh báo về “rủi ro an ninh”. Tuy nhiên, nhu cầu từ Alibaba, Tencent, ByteDance và Baidu vẫn rất cao. Nvidia đã đạt thỏa thuận với chính quyền Trump, trả 15% doanh số H20 để được phép tiếp tục bán. Dù Bắc Kinh khuyến khích dùng chip nội địa, không có lệnh cấm chính thức.
SoftBank và Intel thảo luận về khả năng mua lại hoặc hợp tác trong mảng foundry (sản xuất chip hợp đồng) của Intel. SoftBank đã đầu tư 2 tỉ USD vào cổ phiếu Intel. Chính phủ Mỹ còn xem xét mua 10% cổ phần Intel để củng cố ngành bán dẫn trong nước.
Thị trường chứng khoán Trung Quốc bùng nổ sau “đình chiến thuế quan” Mỹ - Trung: chỉ số ChiNext tăng 26%, vượt xa CSI 300 (9%) và Hang Seng (10,5%). Công ty Victory Giant Technology, nhà cung cấp PCB cho máy chủ AI của Nvidia, tăng hơn 450% từ đầu năm 2024.
Ngành chip công suất Nhật Bản gặp bế tắc khi liên minh Toshiba – Rohm không đạt tiến triển lớn. Năm tập đoàn lớn (Mitsubishi Electric, Fuji Electric, Toshiba, Rohm, Denso) mỗi bên chỉ chiếm chưa tới 5% thị phần toàn cầu. Trong khi đó, Trung Quốc mở rộng sản xuất chip công suất, thúc đẩy ngành xe điện nội địa dùng chip nội.

📌 Nvidia tiếp tục thống trị AI nhưng chịu sức ép kép từ Mỹ và Trung Quốc; H20 vẫn hút cầu tại Bắc Kinh. SoftBank chi 2 tỉ USD vào Intel, mở đường hợp tác sâu hơn. Chứng khoán công nghệ Trung Quốc tăng 26%. Ngược lại, Nhật Bản gặp khó tái cấu trúc ngành chip công suất khi 5 tập đoàn lớn không đạt đồng thuận, trong khi Trung Quốc đẩy mạnh chiếm lĩnh thị phần. Năng lượng và chip đang trở thành trọng tâm trong cạnh tranh công nghệ châu Á.

https://www.ft.com/content/30c13c06-fcba-444b-96fc-cbe17f2969e8

Nvidia’s outlook in China and Japan’s power chip problem
The inside story on the Asia tech trends that matter, from Nikkei Asia and the Financial Times
Nvidia logo

Lauly Li, Cissy Zhou, Yifan Yu, David Keohane, Leo Lewis, Michael Acton, Stephen Morris, Joe Miller, Wataru Suzuki and Ryohtaroh Satoh

Hi everyone! This is Lauly, sending greetings from humid and warm Bangkok where I am on a reporting trip.
I experienced one of the worst traffic jams I can recall on my way from the airport to the hotel on Tuesday. The trip was supposed to take around 40 minutes but ended up taking an hour and 45 minutes. There were several spells in the bumper-to-bumper traffic where we could only inch forward as I jealously watched motorcyclists zipping by us. I thought about how suppliers had warned me that the traffic situation would be a downside to developing Thailand’s tech manufacturing industry, as it would drag down the efficiency. That might be true.
At one point, I tried to think positively and enjoy watching the blossoming magnolia trees along the road. They reminded me of a small bouquet of chrysanthemums I bought a few days ago at a florist’s shop in Taipei, with beautiful peach and salmon-pink flowers.
Speaking of flowers, I was surprised when I entered the florist and saw how small the selection was. The owner explained to me that typhoons and numerous floods in central and southern Taiwan since early July had severely damaged agricultural goods, including flowers. This was unusual, considering Taiwan hasn’t been hit by so many typhoons in years. Fewer typhoons had led to serious droughts that endangered the tech and chip supply chain.
Extreme weather has hit much of the region. A friend working for an airline in Hong Kong told me that a “black rain” warning, which means extremely heavy rain, delayed her flight duty to Beijing for hours. Once passengers had boarded, they were stuck on the ground for several more hours as the bad weather continued before the airline finally decided to postpone the flight to the next day.
Back in Taiwan, there is an escalating debate over the use of nuclear energy. A public referendum to be held on Saturday will ask voters if the Third Nuclear Power Plant should continue operating after authorities confirmed there are no safety concerns with the plant. Nuclear power has always been a highly politicised issue in Taiwan, with sharp divides between the ruling Democratic Progressive party and the opposition Kuomintang and Taiwan People’s Party.
TH Tung, chair of iPhone assembler Pegatron, has been a strong advocate for nuclear over the past two years, saying it would enhance the island’s energy security and support its vital chip and AI industries, which are both very power hungry. The tycoon even attended a televised debate last Friday against DPP lawmaker Chuang Jui-hsiung convened by the Central Election Committee for the upcoming referendum.
Energy is a critical issue for other Asian economies that aim to develop their AI and high-tech industries, as Nikkei Asia reported earlier. Every economy wants to seize the once-in-a-generation opportunity to have its own AI capabilities and build a supply chain outside of China, but they will have to face the question of whether they can secure enough clean energy to sustain economic growth and combat global warming.
Still hungry
Despite the Chinese government’s unexpected public warning over alleged “security” issues with Nvidia’s H20, a downgraded AI chip specially designed for the Chinese market, demand from local tech giants remains strong, write Nikkei Asia’s Cissy Zhou, Yifan Yu, and Lauly Li.
Nvidia, the world’s dominant AI chip provider, has been feeling the geopolitical heat lately. It recently struck a deal with US President Donald Trump to pay 15 per cent of the sales of H20 to the US government in order to resume selling the chip to the Chinese market.
Not long after, Beijing summoned Chinese tech companies like ByteDance, Alibaba, Tencent and Baidu to discuss their use of Nvidia chips and encourage them to use more homegrown options, sources said.
The silver lining for Nvidia is that Beijing was not issuing a ban but rather “advice” on the company’s products, and Chinese tech companies’ pent-up demand for the H20 and upcoming Blackwell chips remains strong, according to industry sources.
Chip chats
SoftBank’s billionaire founder Masayoshi Son held talks with Intel’s chief executive about buying its faltering contract chipmaking business in the weeks before Monday’s announcement that the Japanese company would invest $2bn in the US group’s shares, write the Financial Times’ David Keohane, Leo Lewis, Michael Acton, Stephen Morris and Joe Miller.
Son has met Intel’s Lip-Bu Tan since the latter’s appointment in March to discuss a potential deal, according to multiple people with knowledge of the talks. The US company is seeking to find a solution for its advanced chip manufacturing business, which is struggling to compete with Taiwan’s TSMC.
The talks were wide-ranging and could have led to multiple outcomes, including joint ventures with third parties or a minority investment similar to that announced on Monday. However, two of the people said the announcement did not preclude a bigger deal over Intel’s so-called foundry business in the future.
SoftBank and Intel declined to comment.
Son’s ambitions are being fuelled in part by the US government’s ambitions for Intel. On Wednesday, Trump’s White House said that it was “ironing out the details” of a deal that would entail the US government taking a 10 per cent stake in the company.
On the rise
Line chart of End of 2024 = 100 showing ChiNext has started outperforming benchmark index
Chinese tech suppliers are enjoying a surge in stock performance as the world’s two superpowers continue to keep a lid on the trade war, Nikkei Asia’s Wataru Suzuki writes.
The ChiNext Index, which tracks many Shenzhen-listed companies tied to the global supply chain, is up nearly 26 per cent since Washington and Beijing first agreed a tariff “truce” in Geneva on May 12. It has outperformed the 9 per cent gain in the broader benchmark CSI 300 Index and the 10.5 per cent rise in Hong Kong’s Hang Seng index over the same period. That truce was extended for another 90 days on Aug 12.
Some of the biggest winners from this risk-on appetite are emerging from the country’s high-tech supply chain. Victory Giant Technology, a supplier of printed circuit boards for Nvidia’s AI servers, is up more than 450 per cent this year, with most of the increases coming in the past three months, making it the biggest gainer on the ChiNext Index.
“Investors in China are responding positively to the fact that external pressure has eased,” said Hiroya Yamauchi, China and Asia market specialist at Nikko Asset Management.
Power players
Japanese makers of power semiconductors have long held an important position in the global supply chain. Now, as they are being challenged by the rise of Chinese rivals, they are struggling to form a united front, writes Nikkei Asia’s Ryohtaroh Satoh.
A major power chip alliance between Toshiba and Rohm has struggled to produce tangible results beyond a co-manufacturing project. According to sources briefed on the situation, discussions on deeper collaborations, initially announced in early 2024, have “stalled.”
The lack of visible progress highlights the difficulties in significantly restructuring Japan’s power chip industry, which boasts five major players: Mitsubishi Electric, Fuji Electric, Toshiba, Rohm and Denso, each of which has less than 5 per cent of the global market.
Power semiconductors, which control current flow, are less advanced than AI chips or central processing units (CPU) used for smartphones or PCs, but they are vital in everything from power grids to electric vehicles.
Japan’s power chip industry woes come as China has been aggressively expanding production capacity for mature chips while pushing its automobile supply chain, a heavy consumer of power chips, to use more local supplies.

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute AI pháp lý-quản trị-chủ quyền 2025-08-19 23:51:24

Nvidia âm thầm phát triển chip AI B30A cho Trung Quốc, vượt trội H20

Ngày 19/8/2025, Reuters tiết lộ Nvidia đang phát triển chip AI mới cho Trung Quốc, tên tạm B30A, dựa trên kiến trúc Blackwell, mạnh hơn H20 vốn được phép bán từ tháng 7.
B30A sẽ dùng thiết kế single-die (một khuôn silicon), cho hiệu suất bằng khoảng 50% chip Blackwell B300 dual-die cao cấp.
Chip này tích hợp bộ nhớ băng thông cao (HBM) và công nghệ NVLink, tương tự H20, nhưng hiệu suất được cho là vượt trội hơn.
Nvidia kỳ vọng gửi mẫu thử B30A cho khách hàng Trung Quốc ngay từ tháng 9/2025.
Công ty khẳng định mọi sản phẩm đều tuân thủ phê duyệt của cơ quan quản lý Mỹ và chỉ phục vụ mục đích thương mại. Bộ Thương mại Mỹ chưa bình luận.
Trung Quốc đóng góp 13% doanh thu Nvidia năm tài chính vừa qua, là tâm điểm tranh cãi Mỹ–Trung về công nghệ AI.
Trump cho biết có thể cho phép Nvidia bán phiên bản hạ cấp Blackwell ở Trung Quốc, gợi ý hiệu suất thấp hơn 30–50% so với bản gốc. Đổi lại, Nvidia và AMD phải chia 15% doanh thu bán chip cao cấp cho chính phủ Mỹ.
Quốc hội Mỹ lo ngại ngay cả bản “cắt giảm” vẫn giúp Trung Quốc thu hẹp khoảng cách công nghệ.
Nvidia lập luận cần duy trì khách hàng Trung Quốc để tránh họ chuyển hẳn sang Huawei, vốn tiến bộ nhanh nhưng hệ sinh thái phần mềm và băng thông bộ nhớ còn yếu.
Song, chip H20 gần đây bị truyền thông nhà nước Trung Quốc gắn nhãn “rủi ro an ninh”, và Bắc Kinh khuyến khích doanh nghiệp dùng chip nội địa.
Ngoài B30A, Nvidia cũng chuẩn bị ra chip RTX6000D, thiết kế riêng cho inference, dùng bộ nhớ GDDR, băng thông 1.398 GB/s – thấp hơn ngưỡng kiểm soát 1,4 TB/s của Mỹ, dự kiến giao lô nhỏ tháng 9/2025.

📌 Nvidia phát triển chip B30A dựa trên Blackwell cho Trung Quốc, mạnh hơn H20 và có thể thử nghiệm từ tháng 9/2025. Mỹ vẫn kiểm soát chặt, yêu cầu chia 15% doanh thu, trong khi Huawei tăng tốc cạnh tranh nhưng còn yếu về phần mềm. Nvidia song song tung RTX6000D dưới ngưỡng hạn chế, cho thấy hãng quyết tâm giữ thị phần tại Trung Quốc bất chấp căng thẳng Mỹ–Trung.

https://www.reuters.com/world/china/nvidia-working-new-ai-chip-china-that-outperforms-h20-sources-say-2025-08-19/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-08-19 23:42:03

Nvidia giữ lợi thế tại Trung Quốc dù Bắc Kinh cảnh báo chip H20

Dù Bắc Kinh vừa cảnh báo về “rủi ro an ninh” liên quan chip H20, nhu cầu từ các tập đoàn công nghệ lớn Trung Quốc như ByteDance, Alibaba, Tencent và Baidu vẫn rất cao.
Nvidia chấp nhận trả 15% doanh thu từ chip H20 bán tại Trung Quốc cho chính phủ Mỹ để được phép xuất khẩu. Có kỳ vọng rằng chip Blackwell (phiên bản hạ cấp) cũng sẽ sớm được phép bán.
Chính phủ Trung Quốc chỉ “khuyên” thay thế bằng chip nội địa (Huawei, Biren, Cambricon) chứ không cấm. Các công ty cho biết chưa nhận chỉ đạo bắt buộc và vẫn dùng H20 cho dự án ngoài hạ tầng trọng yếu.
Một số doanh nghiệp đánh giá chip Ascend của Huawei “mạnh mẽ” nhưng hiệu suất thấp hơn Nvidia, tỷ lệ lỗi cao và công suất sản xuất hạn chế.
Tencent khẳng định đã tích trữ đủ GPU cho huấn luyện và nâng cấp mô hình, nhưng nhân viên lo ngại nhu cầu vẫn vượt khả năng dự trữ vì công ty còn cho thuê GPU cho khách hàng ngoài.
Giá cả cũng là lợi thế: H20 rẻ hơn so với chip nội địa cả về mua sắm lẫn chi phí vận hành, trong khi nền tảng CUDA của Nvidia giúp phần mềm tối ưu hơn.
Các nhà cung ứng H20 cho biết đơn hàng không giảm sau cảnh báo an ninh của chính phủ Trung Quốc. Doanh nghiệp Trung Quốc buộc phải “đi hai chân”: tiếp tục mua Nvidia đồng thời tăng tỷ lệ dùng chip nội địa.
Biên lợi nhuận H20 thấp hơn chip Nvidia tiêu chuẩn và còn làm căng thẳng công suất đóng gói tiên tiến CoWoS của TSMC, nhưng giúp Nvidia duy trì thị phần và thể hiện thiện chí với Trung Quốc.
Mỹ và Trung Quốc vẫn căng thẳng: Washington lo ngại “cửa hậu”, Nvidia bác bỏ. Nhà phân tích Bob O’Donnell cho rằng công ty khó thay thế vì các mô hình AI toàn cầu vẫn cần chip Nvidia.
Trump có thể cho phép xuất khẩu Blackwell hạ cấp với bộ nhớ GDDR7 thay vì HBM, nhưng chưa rõ điều kiện chia sẻ doanh thu sẽ ra sao.

📌 Nvidia tiếp tục giữ vị thế tại Trung Quốc nhờ nhu cầu lớn với chip H20, dù Bắc Kinh cảnh báo rủi ro an ninh. Các công ty như Tencent, Alibaba, Baidu vẫn ưu tiên GPU Mỹ vì hiệu suất và giá rẻ hơn chip Huawei. Các nhà cung ứng H20 cho biết đơn hàng không giảm sau cảnh báo an ninh của chính phủ Trung Quốc. Doanh nghiệp Trung Quốc buộc phải “đi hai chân”: tiếp tục mua Nvidia đồng thời tăng tỷ lệ dùng chip nội địa. Nvidia chấp nhận chia 15% doanh thu cho Mỹ, đồng thời chuẩn bị chip Blackwell hạ cấp cho thị trường Trung Quốc. Với hệ sinh thái CUDA, Nvidia gần như không thể thay thế trong ngắn hạn.

https://asia.nikkei.com/business/technology/nvidia-s-china-prospects-undimmed-by-beijing-s-h20-worries

Nvidia's China prospects undimmed by Beijing's H20 worries
Many big tech players still prefer US giant's chips over Huawei offerings
20250819 Nvidia china image
U.S. chipmaker Nvidia appears poised to win back market share in China. (Source photos by Ken Kobayashi and AP)
CISSY ZHOU, YIFAN YU and LAULY LI
August 19, 2025 16:24 JST
HONG KONG/PALO ALTO/TAIPEI -- Chinese tech giants' demand for Nvidia's H20 chips remains strong, paving the way for the American AI king to recover market share in the world's second-biggest economy, despite Beijing's recent warnings over "security" concerns, industry sources say.
In exchange for permission to sell its H20 chips to China, Nvidia has agreed to pay the U.S. government 15% of revenue generated by those sales, and Chinese tech executives say there are hopes that the chipmaker may even be allowed to sell its more advanced Blackwell products there soon.
A potential wrinkle in those plans arose when the Chinese government recently summoned domestic tech giants including ByteDance, Alibaba, Tencent and Baidu to discuss their use of Nvidia chips and encourage them to use more home-grown options, such as Huawei, Biren and Cambricon Technologies, people familiar with the situation told Nikkei Asia.
Bloomberg first reported last week that Beijing was warning against the use of H20, Nvidia's chip downgraded specifically to be sold in China, in government projects.
The silver lining is that Beijing was not issuing a ban, but rather "advice", on Nvidia chips, while Chinese tech companies' pent up demand for H20 and the upcoming Blackwell chips remains strong, according to industrial sources.
An executive from one leading tech company said it so far has not received any directives to purchase more Chinese chips and it understands the advice is not mandatory, adding that nothing close to a ban of Nvidia has been put forward. The person added that their company informed authorities that its projects involving Nvidia chips are not "critical infrastructure" and that it will continue to use the American chips.
The executive also said that despite some Chinese companies hailing Huawei's Ascend chips as "superior," they are less efficient than Nvidia's and have a higher defect rate than expected, while the chipmaker itself is facing issues with capacity constraints.
Last week, Tencent President Martin Lau said in a post-earnings call that the company has a sufficient stockpile of chips for both AI training and model upgrades after reports that it had been summoned by Beijing. However, multiple staff at the company told Nikkei that they are still concerned the stockpile may not be enough as the company not only needs to keep training its models but also rents GPUs, or graphics processing units, to external users.
Another advantage for Nvidia, perhaps surprisingly, is price.
"H20 is actually cheaper to use than some Chinese alternatives" due to both the procurement cost and running efficiency, one Beijing-based venture capitalist told Nikkei Asia. The strength of Nvidia's CUDA computing platform makes it that much harder to replace even if Huawei and others come close on the hardware level, the source added.
An executive with a supplier of H20 server systems told Nikkei Asia that orders for downgraded Nvidia AI chips have not changed significantly since the Chinese government's warning of the alleged security issues.
"For the Chinese CSP [cloud service providers], they still hope to use higher-efficiency chips to conduct their computing tasks," the executive said. "However, every Chinese CSP has to walk with two legs ... meaning that they will continue to buy chips from Nvidia, but they will also increase their use of homegrown chips."
The executive, whose company has worked with Nvidia for more than a decade, said the margin on H20 chips is smaller than Nvidia's normal ones and producing them squeezes the capacity of Taiwan Semiconductor Manufacturing Co.'s advanced chip packaging CoWoS, which is already constrained due to AI infrastructure's exponential demand increases.
"But being able to continue selling H20s into China is a way to show its goodwill to the Chinese government and hold on to its market share there," the person added.
Multiple state media outlets recently said the H20 poses security risks for China after Beijing raised concerns over backdoor access in those chips. Nvidia has denied that its chips have any backdoor issues.
For now, at least, Nvidia's technological edge means it is difficult, if not impossible, to fully replace.
"Every company or country has recognized the importance of developing their own AI capabilities, and the tools they need to get that work done are Nvidia chips. So they're going to buy Nvidia chips, whether they necessarily want to or not, because it's the only option they have," said Bob O'Donnell, president and chief analyst at Technalysis Research.
"There's definitely politics going on, but I don't think it's going to be an issue [for Nvidia to recover in China]," said Dan Ives, managing director at Wedbush Securities.
Nikkei Asia previously reported that Nvidia is preparing a downgraded Blackwell chip, designed for the China market later this year, that will come with GDDR7 memory rather than the more advanced high-bandwidth memory, to comply with U.S. regulations.
Given that such a chip is not yet available in the market and its capability as a downgraded version is not known, Chinese tech companies are adopting a wait and see approach.
It is also unclear if Nvidia would have to pay the U.S. government a similar 15% share of sales -- or possibly even more -- in return for being able to export a downgraded Blackwell to China.
Some are hopeful the Trump administration will further relax export controls to allow Chinese tech companies to procure Blackwell chips, the next generation of the Hopper-infrastructure H20 chips, with fewer restrictions. Trump has said he might make a deal to allow Nvidia to sell downgraded Blackwell chips to China.
"The H20 shows there are always deals to be made with the Trump administration, so maybe there is enough money to be made with selling full-capacity Blackwell to offset any national security concerns Washington may have," said the Beijing-based venture capitalist.
Not everyone is so optimistic.
"I don't think there's the sense that they [Nvidia] necessarily need to" sell full-capacity Blackwell to be competitive in the Chinese market, said O'Donnell. Opposition in Washington, he added, would likely be too strong to allow it anyway.
Tencent, ByteDance, Alibaba, and Baidu didn't respond to a request for comment.
Nvidia reiterated its earlier statements that its chips are secure and that banning sales of the H20 in China would harm U.S. interests.

Không có file đính kèm.

Nguồn tham khảo

Semi-Cloud-DC-Green AI chips-hardware-compute 2025-08-18 23:55:06

Trung tâm dữ liệu AI ở bang Johor Malaysia tiêu thụ khổng lồ điện và nước, đe dọa mục tiêu net-zero

Johor (Malaysia) đã trở thành trung tâm dữ liệu phát triển nhanh nhất Đông Nam Á, thu hút Google, Microsoft, ByteDance nhờ đất rẻ, gần Singapore và ưu đãi chính phủ.
Công suất hiện tại: 580 MW, nhưng công suất dự kiến (bao gồm dự án đang triển khai) đạt 5.800 MW, đủ cấp điện cho 5,7 triệu hộ mỗi giờ (theo DC Byte).
Kenanga Investment Bank dự báo đến 2035, điện tiêu thụ cho trung tâm dữ liệu tại Malaysia sẽ chiếm 20% tổng công suất phát điện quốc gia.
Malaysia dự kiến bổ sung 6-8 GW điện khí để đáp ứng nhu cầu, trong khi điện than vẫn chiếm 43% năm 2023. Điều này có thể mâu thuẫn với mục tiêu net-zero 2050.
Về nước: một trung tâm 100 MW cần khoảng 4,2 triệu lít/ngày để làm mát, tương đương nhu cầu của hàng nghìn dân. Johor đã xây dựng 3 hồ chứa và nhà máy xử lý nước mới, đồng thời áp dụng biểu phí nước cao hơn cho trung tâm dữ liệu.
Ngành này từng khiến Johor phải nhập nước từ Singapore, làm dấy lên lo ngại về an ninh tài nguyên. Chính phủ Malaysia kêu gọi chuyển sang dùng nước tái chế và trung tâm dữ liệu không dùng nước làm mát.
Bức tranh toàn cầu: theo IMF, điện tiêu thụ bởi trung tâm dữ liệu toàn cầu năm 2023 đã ngang bằng Đức và Pháp. Một số nghiên cứu dự báo đến 2027, AI có thể tiêu thụ lượng nước gấp 4-6 lần Đan Mạch.
Mỹ – thị trường trung tâm dữ liệu lớn nhất – dự kiến hóa đơn điện tăng 8% và phát thải CO₂ tăng 30% vào 2030 do AI và khai thác tiền mã hóa.
Singapore từng áp lệnh cấm 3 năm với trung tâm dữ liệu (2019-2022), sau đó đưa ra “Green Data Centre Roadmap”. Hiện tăng trưởng bị kiềm chế, dẫn đến dịch chuyển sang Johor.
Malaysia chuẩn bị ra mắt “Sustainable Data Centre Framework” vào tháng 10/2025, đồng thời mở rộng năng lượng tái tạo và nghiên cứu năng lượng hạt nhân.

📌 Bang Johor Malaysia đang bùng nổ với tương lai 5.800 MW công suất trung tâm dữ liệu, có thể tiêu thụ 20% điện Malaysia vào 2035. Một trung tâm 100 MW cần khoảng 4,2 triệu lít/ngày để làm mát. Chính phủ đầu tư hồ chứa mới, áp giá nước cao và thúc đẩy tái chế, song vẫn đối mặt nguy cơ xung đột mục tiêu net-zero 2050. Ngành này từng khiến Johor phải nhập nước từ Singapore, làm dấy lên lo ngại về an ninh tài nguyên. Chính phủ Malaysia kêu gọi chuyển sang dùng nước tái chế và trung tâm dữ liệu không dùng nước làm mát. Malaysia chuẩn bị ra mắt “Sustainable Data Centre Framework” vào tháng 10/2025, đồng thời mở rộng năng lượng tái tạo và nghiên cứu năng lượng hạt nhân.

https://www.cnbc.com/2025/08/18/an-asian-data-center-hub-is-quietly-grappling-with-ais-massive-costs.html

This Asian data center hub is quietly grappling with the massive costs of AI: energy and water

Published Mon, Aug 18 2025•12:34 AM EDT|Updated 10 Min Ago

Dylan Butts @in/dylan-b-7a451a107

Victoria Yeo

Key Points

Malaysia’s Johor has a total planned data center capacity of 5,800 megawatts, according to DC Byte.
Data center projects have created economic opportunities and jobs for the city.
But there are signs the industry is pushing the limits of the state’s capacity and natural resources.

The artificial intelligence boom has brought with it hundreds of billions of dollars in investments and promises of economic growth . But the infrastructure required is demanding massive amounts of energy and resources. One lesser-known example of that dilemma can be found in the southern tip of Malaysia, which has quietly become one of Southeast Asia’s fastest-growing data center hubs amid the heightened compute demands of AI. The country’s state of Johor — with a population of about 4 million people — has attracted billions’ worth of projects for such data centers in recent years , including from many of the world’s largest technology firms, such as Google , Microsoft and China’s ByteDance . Backers of those projects have been drawn by Johor’s cheap land and resources, proximity to the financial hub of Singapore, and government incentives. But though that has created new economic opportunities and jobs, there are signs the industry is pushing the limits of the state’s energy capacity and natural resources, with officials slowing approvals for new projects. Energy needs and hurdles While Johor currently has about 580 megawatts (MW) of data center capacity, its total planned capacity — including early-stage projects — is nearly 10 times that amount, according to figures provided by data center market intelligence firm DC Byte. That energy capacity would be enough to power up to 5.7 million households an hour , according to calculations based on data from PKnergy . Meanwhile, though Johor accounts for the majority of Malaysia’s planned data centers, other hubs in the country have been sprouting up. Kenanga Investment Bank Berhad, a Malaysian independent investment bank, has projected that the electricity use of the country’s data centers will equate to 20% of its total energy-generating capacity by 2035. In the face of those growing demands, a Malaysian industry official told reporters in June that the country expects to add 6 to 8 gigawatts of gas-fired power, with total power consumption on track to increase 30% by 2030. Though the natural gas used in these power stations burns cleaner than coal — which accounted for more than 43% of Malaysia’s electricity in 2023 — reliance on it for future data center expansion could clash with the country’s plan to achieve net-zero emissions as early as 2050. Another critical challenge is water, which is used by data centers in large quantities to cool down electrical components and prevent overheating. It’s been estimated that an average 100 MW data center uses about 4.2 million liters of water per day — the equivalent of supplying thousands of residents . It’s therefore no surprise that Johor, which has experienced several supply disruptions and already relies on neighboring Singapore for a sizeable amount of its treated water, is reportedly in the process of building three new reservoirs and water treatment plants. Global picture Data centers are the backbone of the digital world, hosting the information and computing resources that power everything from e-commerce to social media to digital banking, and increasingly, generative AI models. Demand and investor appetite for such centers have never been higher, given the massive computing power needs of AI , with Johor serving as just one example of the industry’s growth and the energy and water challenges that come with it. According to a May report by the International Monetary Fund, electricity used by the world’s data centers had already reached the levels of Germany and France in 2023, soon after the launch of OpenAI’s groundbreaking ChatGPT AI model. Meanwhile, some researchers have estimated that AI-related infrastructure could consume four to six times more water than Denmark by 2027. The industry’s growth is expected to continue to accelerate, though projections of future capacity vary widely. One thing that is clear is that data center construction is struggling to keep up with demand in light of power constraints and permitting delays, according to DC Byte. In response, some governments have been working to speed up approval processes and bring new and cheap energy online, with some environmentalists warning such moves could clash with global net-zero goals. The United States — the world’s largest data center market— has exemplified that dynamic. U.S. President Donald Trump recently launched ” America’s AI Action Plan ,” calling for streamlined permitting and the removal of environmental regulations to speed up the development of AI infrastructure and the energy needed to power it. A June analysis from Carnegie Mellon University and North Carolina State University projected that by 2030, Americans’ electricity bills are on track to rise 8% and greenhouse gas emissions from power generation 30% as a result of growth in data centers and cryptocurrency mining. Resource solutions? Malaysia, for its part, has signaled its desire to rein in the data center industry’s energy and resource use. The government plans to launch a “Sustainable Data Centre Framework” by October, Tengku Zafrul, investment, trade and industry minister, said in a post on X in July. To meet growing power needs, officials have also been approving more renewable energy projects , while also exploring the potential use of nuclear energy . As for water, higher water tariffs were placed on Johor’s data centers earlier this month, with the government pushing for the industry to shift to using recycled wastewater . Notably, some newer data centers don’t rely on any water for cooling. Regionally, concerns about resource-intensive data centers are nothing new. In 2019, Singapore cracked down on the industry, imposing a three-year moratorium on new data centers in order to stem power and water usage. It was after that crackdown that the industry began its major shift to the friendlier regulatory environment of Johor. Singapore ended its moratorium in 2022 and launched its “Green Data Centre Roadmap ,” aimed at optimizing energy efficiency and adopting green energy for data centers. However, according to data from DC Byte, growth in the city-state remains tempered , especially when compared with Malaysia. Stricter approaches could, however, lead to spillover to less-regulated markets. As few international guardrails are in place, environmentalists and organizations like the United Nations Environment Programme have been calling for global legislation. “There are no unavoidable AI uses, and whether we move towards net-zero emissions is a choice,” Jonathan Koomey , a leading independent researcher on the energy and environmental effects of information technology, told CNBC in an email. “There is no reason, in my view, why data center companies shouldn’t power AI expansion with zero emissions power. There is also no reason to abandon climate goals because AI companies say their expansion is urgent.”

Không có file đính kèm.

Nguồn tham khảo

AI pháp lý-quản trị-chủ quyền AI chips-hardware-compute 2025-08-18 07:29:39

Trung Quốc bắt buộc trung tâm dữ liệu dùng 50% chip AI nội địa thay Nvidia

Chính phủ Trung Quốc vừa ban hành quy định yêu cầu các trung tâm dữ liệu công cộng phải sử dụng trên 50% chip AI nội địa, nhằm giảm phụ thuộc vào công nghệ Mỹ giữa bối cảnh Washington siết chặt kiểm soát xuất khẩu bán dẫn.
Chính sách bắt nguồn từ hướng dẫn của Thượng Hải tháng 3/2024, đặt mục tiêu đến năm 2025 các trung tâm tính toán thông minh của thành phố phải vượt ngưỡng 50% chip nội địa. Từ đầu 2025, quy định này đã trở thành chính sách toàn quốc.
Hơn 500 dự án trung tâm dữ liệu mới được công bố tại Trung Quốc trong 2023–2024, trải dài từ Nội Mông đến Quảng Đông, nhằm đáp ứng nhu cầu bùng nổ của AI tạo sinh.
Các chip Nvidia H100, H800 bị Mỹ cấm xuất sang Trung Quốc, trong khi chip H20 vừa được dỡ bỏ hạn chế vẫn bị Bắc Kinh nghi ngờ về rủi ro an ninh mạng. Nvidia phủ nhận cáo buộc này.
Chip nội địa, điển hình Huawei Ascend, hiện đáp ứng được suy luận (inference) trên mô hình đã huấn luyện, nhưng còn yếu trong huấn luyện AI mới. Vì vậy, Nvidia vẫn là lựa chọn hàng đầu cho phần lớn nhà phát triển.
iFlytek (đang bị Mỹ trừng phạt) là công ty Trung Quốc duy nhất công khai dùng chip Huawei để huấn luyện mô hình AI.
Vấn đề lớn: hệ sinh thái phần mềm. Nvidia sở hữu CUDA, Huawei dùng CANN. Việc chuyển đổi mô hình giữa hai nền tảng gây tốn công và rủi ro cho các trung tâm dữ liệu.
Công ty SiliconFlow (Bắc Kinh) hợp tác với Huawei xây dựng giải pháp tối ưu DeepSeek R1 trên kiến trúc Cloud Matrix 384 và chip Ascend, đạt hiệu quả vượt Nvidia H800, theo nghiên cứu công bố tháng 6/2025.
Tuy vậy, nhiều trung tâm dữ liệu bình thường không đủ kỹ sư trình độ cao để xử lý thách thức tích hợp chip hỗn hợp, khiến quá trình “nội địa hóa” chip AI gặp khó khăn.

📌 Trung Quốc ban hành quy định buộc trung tâm dữ liệu phải dùng trên 50% chip AI nội địa, trong bối cảnh Mỹ cấm xuất khẩu H100/H800. Hơn 500 dự án mới khởi động từ 2023–2024, nhưng chip Huawei Ascend vẫn yếu ở huấn luyện mô hình. SiliconFlow + Huawei chứng minh DeepSeek R1 chạy hiệu quả hơn Nvidia H800, song phần lớn trung tâm dữ liệu gặp khó do rào cản phần mềm (CUDA vs CANN). Chính sách thể hiện quyết tâm tự chủ bán dẫn nhưng đi kèm thách thức kỹ thuật lớn.

https://www.scmp.com/tech/tech-war/article/3322119/china-mandates-more-domestic-ai-chips-data-centres-cut-reliance-nvidia

China mandates more domestic AI chips for data centres to cut reliance on Nvidia

In 2023 and 2024, more than 500 new data centre projects were announced across the country, in places such as Inner Mongolia and Guangdong

Ben Jiangin Beijing

Published: 2:00pm, 17 Aug 2025

China is requiring its data centres to use more home-grown computing chips in a move that underscores Beijing’s accelerated efforts to cut reliance on foreign technology as the US tightens export controls.

Publicly owned computing hubs across the country have been asked to source more than 50 per cent of their chips from domestic producers to support the indigenous semiconductor sector, according to people familiar with the matter.

The mandate finds its origins in guidelines proposed in March last year by the Shanghai municipality, which was among the first in the country to stipulate that “adoption of domestic computing and storage chips at the city’s intelligent computing centres should be above 50 per cent by 2025”.

The guidelines were part of a policy to strengthen artificial intelligence computing resources in China’s financial hub. The plan was backed by government agencies including branches of the National Development and Reform Commission (NDRC) in the city and the Shanghai Communications Administration, an agency under the Ministry of Industry and Information Technology (MIIT).

One source, who works as an adviser in the data centre industry, said that earlier this year the Shanghai chip quotas for the city’s intelligent computing centres had become mandatory nationwide policy.

he MIIT and NDRC did not immediately respond to a request for comment on Saturday outside business hours.

The latest move comes as China has pushed harder for more tech autonomy, as the US further tightens export controls to restrict Chinese access to advanced semiconductors amid a protracted tech war in critical fields such as AI.

As part of its response, China has sped up the construction of so-called intelligent computing centres that pool computing resources to meet the demands of the local AI industry.

In 2023 and 2024, more than 500 new data centre projects were announced across the country, in places such as Inner Mongolia and Guangdong, according to MIT Technology Review, which cited data from market research firm KZ Consulting.

Generative AI technology demands substantial computing resources, which rely on advanced semiconductors such as Nvidia’s H100 and H800 chips, which Washington has prohibited from being exported to China.

The Chinese government has also questioned whether H20 chips, which recently received US approval for sale to Chinese customers after a short suspension, pose network security hazards to the country, an allegation that Nvidia has refuted.

Chinese chips, despite being inferior to those of Nvidia, were “usable” in inferencing for trained AI models, but when it came to training new AI models, Nvidia chips were still the go-to choice among mainstream AI developers, another source added.

US-sanctioned iFlytek is the only Chinese tech firm that has publicly announced it is using Huawei Technologies’ chips to train its AI models.

Meanwhile, the rush to adopt local AI chips has led to technical challenges for AI data centres that use a mix of domestic and foreign chips, according to the source.

AI chips typically run on an accompanying software ecosystem from their manufacturer, such as Nvidia’s CUDA, or Huawei CANN. Models developed on one solution need to be adapted to run on another company’s chips, which can prove to be a challenging task.

With most Chinese AI models still developed using Nvidia solutions, China’s AI data centres – unlike AI specialist firms such as SiliconFlow staffed with top engineers – were facing mounting “adaptation” challenges as they add more domestic chips, the source said.

Beijing-based SiliconFlow, in partnership with Huawei, developed a solution to use Huawei’s Cloud Matrix 384 data centre architecture and Ascend chips to run DeepSeek’s R1 models more efficiently than Nvidia’s H800, according to joint research published in June.

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-08-15 06:36:16

Bùng nổ AI trị giá 3.000 tỷ USD đang kéo theo làn sóng xây dựng trung tâm dữ liệu toàn cầu chưa từng có

Các ông lớn công nghệ như Meta, OpenAI và xAI đang triển khai các dự án siêu máy tính AI trị giá trên 100 tỷ USD mỗi dự án như “Stargate”, “Colossus”, và “Prometheus” – chỉ là phần nhỏ trong cuộc bùng nổ đầu tư trị giá 3.000 tỷ USD để xây dựng trung tâm dữ liệu toàn cầu đến năm 2029.
Chỉ riêng năm 2026, Google, Amazon, Microsoft và Meta dự kiến sẽ chi hơn 400 tỷ USD cho trung tâm dữ liệu, vượt mức 350 tỷ USD của năm 2025.
Nhưng sức mạnh tài chính của Big Tech cũng đang bị thử thách. Với doanh thu AI tạo sinh năm 2024 chỉ đạt 45 tỷ USD, nhiều nhà đầu tư bắt đầu đặt câu hỏi về lợi nhuận thực sự từ cuộc đua hạ tầng này.
Khoảng trống 1.500 tỷ USD vốn đầu tư (trên tổng 3.000 tỷ) sẽ phải đến từ bên ngoài Big Tech – gồm quỹ đầu tư tư nhân, nợ vay ngân hàng, trái phiếu, và vốn chủ sở hữu từ các tổ chức như Blackstone, KKR, Apollo...
Meta đã huy động 29 tỷ USD (trong đó có 26 tỷ USD nợ) từ nhóm nhà đầu tư do Pimco dẫn đầu để xây dựng trung tâm dữ liệu tại Ohio và Louisiana.
Oracle không tự xây dựng mà thuê 2GW trung tâm dữ liệu tại Texas từ startup Crusoe, được tài trợ bởi 5 tỷ USD vốn chủ sở hữu và 10 tỷ USD vay từ JPMorgan, phục vụ hợp đồng trị giá 30 tỷ USD/năm với OpenAI.
Mô hình “build-to-suit” đang phổ biến: bên phát triển chịu rủi ro đầu tư, còn Big Tech chỉ cam kết thuê dài hạn – nhấn mạnh vai trò ngày càng lớn của nợ vay trong lĩnh vực này.
CoreWeave, khởi nghiệp từ khai thác tiền số, hiện trị giá 65 tỷ USD, là ví dụ điển hình cho xu hướng mới: huy động 10 tỷ USD từ Blackstone, thế chấp bằng GPU và hợp đồng cho Microsoft thuê sức mạnh tính toán.
Tuy nhiên, nhiều chuyên gia cảnh báo rủi ro:
- Công nghệ chip AI lỗi thời (đặc biệt là khi Nvidia liên tục ra thế hệ mới).
- Hệ thống làm mát trung tâm dữ liệu có thể nhanh chóng lạc hậu.
- Một số trung tâm dữ liệu có thể trở thành “nhà kho không dùng được” trong 10 năm tới nếu nhu cầu AI suy giảm.
Các khoản nợ đang đổ vào các startup hoặc nhà phát triển chưa có khách thuê chính thức, làm tăng rủi ro vỡ nợ. Một số nhà đầu tư đã bắt đầu tránh các thương vụ chứng khoán hóa tài sản trung tâm dữ liệu vì lo ngại giá trị tài sản sẽ biến mất trước khi trái phiếu đáo hạn.
Câu hỏi lớn: nếu doanh nghiệp không chi trả đủ cho dịch vụ AI như kỳ vọng, toàn bộ cấu trúc tài chính này có thể sụp đổ theo mô hình "dot-com" hoặc “bong bóng viễn thông” cuối thập niên 1990.
Các nhà phát triển trung tâm dữ liệu đang gánh nợ cao và phụ thuộc vào mức thuê hiện tại, nhưng nếu chu kỳ sụt giảm xảy ra, họ sẽ là bên tổn thất đầu tiên – chứ không phải các tập đoàn lớn.

📌 Cơn sốt AI tạo ra một cuộc đua cơ sở hạ tầng trị giá 3.000 tỷ USD, với Big Tech và giới tài chính tư nhân ồ ạt rót vốn vào trung tâm dữ liệu và siêu máy tính. Nhưng rủi ro cũng tăng theo: công nghệ lỗi thời, chi phí tăng vọt, dư thừa công suất và mô hình tài chính dựa vào giả định rằng “AI sẽ dùng cho mọi thứ”. Sự bùng nổ này có thể trở thành bong bóng nếu nhu cầu không theo kịp kỳ vọng.

https://www.ft.com/content/efe1e350-62c6-4aa0-a833-f6da01265473

‘Absolutely immense’: the companies on the hook for the $3tn AI building boom
Private capital joins Big Tech in seeking to capture rewards from historic expansion of data centres

Tabby Kinder in San Francisco
Published17 hours ago

Meta is building “Prometheus” and “Hyperion”, Elon Musk’s xAI has “Colossus”, and OpenAI is developing “Stargate” — each a more than $100bn project to build the world’s most powerful supercomputer and usher in a new generation of artificial intelligence.
But each of those gargantuan ventures is just a fraction of the spending required to build the data centres needed to power the AI era: one of the biggest movements of capital in modern history.
“The amount of capital required is absolutely immense,” said Rob Horn, global head of infrastructure and asset-based credit at private equity group Blackstone, which manages an $85bn data centre platform.
“The scale of the opportunity is exhausting the capital of [any one financial] market, and is requiring an all-of-the-above approach, with private capital playing a very large role.”
Google, Amazon, Microsoft and Meta will spend more than $400bn on data centres in 2026 — on top of more than $350bn this year.
For years, Big Tech’s capital spending grew steadily, focused on cloud, logistics and underlying infrastructure
Then came the launch of ChatGPT in late 2022 and with it a realisation that AI could upend their businesses
Now begins an arms race, where billions are poured into servers, chips and data centres to power generative AI
But as the money floods in, concerns are being raised about overcapacity, long-term profitability and energy demands.
“Lots of people who are trying to build data centres will fail,” said one banker who helps arrange financing for AI infrastructure projects.
“We are in that period where the capital markets are crazy enough to throw money at almost anything. I am curious to see the next phase and whether rationality prevails.”
Once seen as a niche part of the real estate market, the frenzied pace of construction has turned data centres into a sought-after asset class.
This year is forecast to break records for development. The US has about 20 gigawatts of operational data centre capacity. Before the end of the year, another 10GW of data centres are projected to break ground globally, and 7GW will reach completion, according to real estate group JLL.
Historically, most of the spending by the “hyperscalers” — Amazon Web Services, Microsoft Azure and Google Cloud — building data centres for their cloud services businesses was self-funded.
But the scale of computing power needed for generative AI is changing that.
The AI race

This is the third part in a series exploring the race for AI capacity and the data centres at the heart of billions of dollars in capital investment.
Part 1: Inside the relentless race for AI capacity
Part 2: Can data centres ever truly be green?
Part 3: Financing the data centre boom
While internal cash flows largely covered costs of up to $200bn last year, costs are projected to double this year and increase further next.
Some economists have started to question how much further hyperscalers’ cash reserves can be stretched, and investors want to know when their spending will translate to real revenues from AI services. Hyperscalers’ generative AI revenues were just $45bn last year, according to Morgan Stanley analysts — although they predicted revenues would exceed $1tn by 2028.
This has left a funding chasm that financiers are rushing to fill.
JLL estimates $170bn of assets will require construction lending or permanent financing this year. Between now and 2029, however, global spending on data centres will hit almost $3tn, according to Morgan Stanley analysts. Of that, just $1.4tn is forecast to come from capital expenditure by Big Tech groups, leaving a mammoth $1.5tn of financing required from investors and developers.
The gap will be filled by everything from private equity, venture capital and sovereign wealth to bank loans, publicly listed debt and private credit. But increasingly, the answer is debt.
About $60bn of loans are going into roughly $440bn of data centre development projects this year, twice as much debt as in 2024, according to a recent presentation by law firm Norton Rose Fulbright. More than $25bn of loans were underwritten in the first quarter of this year alone, according to a report by Newmark.
Funding data centres comes not just with the risk that costs overrun, but also that the technology becomes obsolete far quicker than anticipated, requiring new investment that decreases returns for its owner — or forces them to sell at a discount. That means even the deepest-pocketed tech groups may want to share the risk, particularly when debt is cheap and readily available.
Deals are being structured in myriad different ways, from structured debt solutions and project finance vehicles to construction loans, asset-backed securitisations and even green bonds to raise money and start building.
Meta raised $29bn — including $26bn of debt — from private capital investors led by Pimco this month to help fund data centres in Ohio and Louisiana, enabling it to offset high upfront costs and spend its cash on other initiatives with faster returns.
Investors including Apollo, Carlyle, Brookfield and KKR competed in a months-long bidding war to lend to Meta.
Oracle takes a different approach with the 2GW data centre it has signed up to lease in Abilene, Texas. The project is being built by start-up Crusoe and investment group Blue Owl Capital, which have raised about $5bn of equity from investors and borrowed almost $10bn from JPMorgan to fund the construction, backed by Oracle’s 15-year lease.
In turn, Oracle has agreed to provide OpenAI with 4.5GW of computing power — including from Abilene — in a deal worth about $30bn a year, which forms the first part of OpenAI’s Stargate data centre project in the US. Neither Oracle nor OpenAI will carry the debt raised to build the Abilene site on their balance sheet.
This data centre development model, known as “build-to-suit”, is being replicated by tech companies across the US.
A rendering of Meta’s plans for the Ohio Bowling Green Data Center
Meta raised $29bn — including $26bn of debt — from investors led by Pimco to help fund data centres in Ohio, pictured, and Louisiana © Meta
“All of the major hyperscalers have self-build programmes. Where third-party developers can add value is when we have sites that are shovel-ready and can deliver on an accelerated timeframe,” said Tim McGuire, capital markets leader for hyperscale data centre developer Rowan Digital.
He said the process of identifying a site, securing the necessary power and building the infrastructure can be a “three-year plus lifecycle. We can cut that cycle in half.”
To get comfortable with the risk involved in a build-to-suit project, lenders, equity investors and developers require hyperscale tenants to sign long-term leases or capacity commitments before they part with their cash. This means they are in effect lending against the creditworthiness of an investment-grade counterparty such as Microsoft or Oracle, a bet that is prompting a race among private capital providers to offer more and larger loans.
In some cases, it also means acquiring data centre developers themselves. Last year, Blackstone bought Australian data centre platform AirTrunk for $14.9bn, the second-largest data centre deal after KKR and Global Infrastructure Partners’ 2021 purchase of US data centre owner CyrusOne for $15.5bn. Last week, Apollo struck its own deal, buying a majority stake in data centre builder Stream.
Apollo said data centres would require “several trillion dollars of global investment over the next decade”; it has already deployed $38bn into data centre-related infrastructure.
But the scale of capital deployment has turned companies with access to land, power or the specialised computer chips used to power AI data centres into potentially very valuable players — if they can prove themselves capable of delivering results for hyperscale tenants.
The building site for a data centre in Abilene, Texas
Oracle has signed a 15-year lease for a 2GW data centre in Abilene, Texas, from which it will partly provide OpenAI with 4.5GW of computing power © OpenAI
“We see multiple developers every week who have undeveloped land but think that they will be signing leases with hyperscale customers tomorrow,” said Sam Southall of Macquarie Capital.
“Essentially everyone with some land and a tenuous path to power is trying to raise capital, but there is a long way to go in order to have credibility with, and be trusted by, these types of tenants.”
Chief among those to have made this play is CoreWeave, a small company founded to mine cryptocurrencies in 2017, a function that required the high-performance Nvidia graphics processing units (GPUs) that have become a key element in training AI models. CoreWeave made the pivot to leasing and operating AI data centres years later, then listed its shares on the Nasdaq exchange in March. It is now worth $65bn.
The New Jersey-based company funded its shift to AI with large loans, including about $10bn from Blackstone. Blackstone took security both over CoreWeave’s GPUs — an increasingly popular form of asset-backed financing for AI data centres — and its contracts to lease computing power to Microsoft. Crusoe, which is building Oracle’s Abilene data centre, also started as a crypto-mining company with access to power contracts.
“Data centres are just a fraction of the capital needed,” said Blackstone’s Horn. “If you have a 1GW data centre, it will cost over $10bn, but all of the equipment costs another $30bn plus. There is not just a data centre financing opportunity, but an opportunity around equipment, inventory and supply chain finance.”
Powering AI makes up less than half of data centre demand at the moment, but it is responsible for almost all of the growth.
The pace of development has drawn comparisons with the telecoms bubble in the late 1990s, when companies laid more than 80mn miles of fibre optic cables across the US in a drastic overestimate of the demand required. The glut meant costs plummeted and many companies failed.
“People are making forecasts on the assumption that all enterprises will start to use AI technology and pay for it, and pay enough for it to justify the return on investment for all these training facilities,” said a banker who works on data centre deals.
“The conclusion is that we’re all going to be using AI all the time for everything. That’s an incomprehensible world, but one you need to believe in order to not see how this all ends up losing money.”
Big Tech companies stand to lose the most if forecasts about the potential of AI — and the money to be made — are overcooked. By self-funding and owning a large proportion of their data centre capacity, they take on the capital expenditure, operational risks and regulatory burden.
The AI race

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute AI pháp lý-quản trị-chủ quyền 2025-08-12 23:07:17

Bắc Kinh yêu cầu Alibaba và ByteDance giải trình lý do đặt mua chip AI H20 của Nvidia thay vì chip nội địa

Bắc Kinh yêu cầu các công ty công nghệ như Alibaba và ByteDance giải trình lý do đặt mua chip AI H20 của Nvidia thay vì chip nội địa, theo chỉ đạo từ Bộ Công nghiệp và Công nghệ Thông tin (MIIT).
Một số doanh nghiệp dự kiến giảm quy mô đơn hàng H20 vì lo ngại áp lực chính trị, dù việc mua không bị cấm nhưng bị xem là “không đúng đắn về chính trị” trong bối cảnh hiện tại.
Trung Quốc ngày càng phản đối việc dùng chip Nvidia trong các dự án chính phủ hoặc an ninh, đồng thời thúc đẩy chip nội địa từ Huawei và Cambricon để thay thế.
Trước đó, Nvidia đã đạt thỏa thuận với chính quyền Trump, chấp nhận trả 15% doanh thu từ chip bán tại Trung Quốc để nối lại xuất khẩu H20. Thỏa thuận này bị các chuyên gia an ninh Mỹ chỉ trích vì có thể hỗ trợ quân đội Trung Quốc và làm suy yếu lợi thế AI của Mỹ.
Bắc Kinh cũng bày tỏ lo ngại về khả năng theo dõi vị trí hoặc tắt từ xa trong chip Nvidia, dù công ty phủ nhận.
Trump cho biết có thể cho phép Nvidia bán chip AI tiên tiến hơn tại Trung Quốc dựa trên nền tảng Blackwell, nhưng hiệu năng H20 tại Trung Quốc hiện bị giới hạn so với chip bán tại Mỹ.
Theo Bernstein, thị phần Nvidia tại thị trường chip AI Trung Quốc dự kiến giảm từ 66% (2024) xuống còn 55% trong năm 2025 do cạnh tranh từ sản phẩm nội địa.

📌 Bắc Kinh yêu cầu các công ty công nghệ như Alibaba và ByteDance giải trình lý do đặt mua chip AI H20 của Nvidia thay vì chip nội địa. Một số doanh nghiệp dự kiến giảm quy mô đơn hàng H20 vì lo ngại áp lực chính trị, dù việc mua không bị cấm nhưng bị xem là “không đúng đắn về chính trị”. Trung Quốc ngày càng phản đối việc dùng chip Nvidia trong các dự án chính phủ hoặc an ninh, đồng thời thúc đẩy chip nội địa từ Huawei và Cambricon để thay thế. Trump cho biết có thể cho phép Nvidia bán chip AI tiên tiến hơn tại Trung Quốc dựa trên nền tảng Blackwell

https://www.ft.com/content/a29bab5e-7c2f-4487-b0a5-d594d577c73a

Beijing puts pressure on Chinese tech giants over purchases of Nvidia’s H20 chips

Alibaba and ByteDance among companies who have received questions from regulators

Zijing Wu in Hong Kong and Eleanor Olcott in Beijing

Published17 minutes ago

Beijing is putting pressure on tech companies including Alibaba and ByteDance over their orders of Nvidia’s H20 artificial intelligence chips, complicating the US chipmaker’s business in China after striking an export arrangement with the Trump administration.

The tech companies have been asked by regulators such as the Ministry of Industry and Information Technology (MIIT) to explain why they need to order Nvidia’s H20 chips instead of using domestic alternatives, said three people familiar with the situation.

Some tech companies, who were the main buyers of Nvidia’s H20 chips before their sale in China was restricted, were planning to downsize their orders as a result of the questions from regulators, said two of the people.

“It’s not banned but has kind of become a politically incorrect thing to do,” said one Chinese data centre operator about purchasing Nvidia’s H20 chips.

Alibaba, ByteDance and MIIT did not immediately respond to a request for comment.

Chinese regulators have expressed growing disapproval of companies using Nvidia’s chips for any government or security related projects. Bloomberg reported on Tuesday that Chinese authorities had sent notices to a range of companies discouraging the use of the H20 chips, particularly for government-related work.

Beijing is also working to promote domestic alternatives to Nvidia. Chinese chipmakers led by Huawei and Cambricon have been gaining market share after Nvidia’s H20 sales were restricted.

Nvidia, which recently agreed to pay the US government 15 per cent of its revenues from chip sales in China in order to restart H20 sales to the country, is at the centre of a geopolitical battle between Beijing and Washington.

The H20 revenue deal was criticised by US security experts who said the chips would help the Chinese military and undermine US strength in artificial intelligence.

Beijing has expressed concerns about security issues associated with Nvidia’s products, such as potential location tracking and remote shutdown capabilities. The US chipmaker denied having those features.

Trump said on Monday that he might allow Nvidia to sell a more advanced artificial intelligence chip in China based on the chipmaker’s latest and most advanced Blackwell platform. The performance of H20 chips sold to China is restricted compared with those more advanced processors sold to customers in the US.

Bernstein analysts said in a recent report that it expected Nvidia’s China chip market share to drop to 55 per cent this year from 66 per cent in 2024.

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute AI cybersecurity 2025-08-10 21:05:03

Trung Quốc tố chip AI H20 của Nvidia kém an toàn và có “cửa hậu”

Ngày 10/8/2025, tài khoản Yuyuan Tantian (thuộc CCTV) đăng trên WeChat rằng chip AI H20 của Nvidia không an toàn, không tiên tiến và không thân thiện môi trường.
Bài viết kết luận người tiêu dùng có quyền từ chối mua sản phẩm như vậy.
H20 được Nvidia phát triển riêng cho thị trường Trung Quốc sau khi Mỹ áp đặt hạn chế xuất khẩu chip AI tiên tiến cuối 2023.
Tháng 4/2025, chính quyền Tổng thống Donald Trump cấm bán H20 cho Trung Quốc, nhưng đến tháng 7 đã đảo ngược lệnh cấm.
Ngày 31/7, Cục quản lý không gian mạng Trung Quốc triệu tập Nvidia để giải thích về nghi vấn tồn tại “cửa hậu” — cơ chế phần cứng cho phép bỏ qua xác thực hoặc kiểm soát bảo mật.
Nvidia khẳng định sản phẩm không có “cửa hậu” cho phép truy cập hoặc điều khiển từ xa.
Tuy nhiên, Yuyuan Tantian nói chip Nvidia có thể thực hiện chức năng “tắt nguồn từ xa” thông qua phần cứng dạng “cửa hậu”.
People’s Daily (Nhân Dân Nhật Báo) trước đó cũng yêu cầu Nvidia đưa ra “bằng chứng bảo mật thuyết phục” để xóa bỏ lo ngại của người dùng Trung Quốc và khôi phục niềm tin thị trường.
Vụ việc diễn ra trong bối cảnh căng thẳng thương mại và công nghệ Mỹ–Trung leo thang, đặc biệt về chip AI và điện toán hiệu năng cao.
H20 bị chỉ trích không chỉ về an ninh mà còn về khả năng kỹ thuật và tác động môi trường, khiến tương lai tiêu thụ tại Trung Quốc bị đe dọa.

📌 Chip AI H20 của Nvidia bị truyền thông nhà nước Trung Quốc cáo buộc có “cửa hậu” cho phép tắt nguồn từ xa, kém tiên tiến và không thân thiện môi trường. Sự việc làm gia tăng căng thẳng công nghệ Mỹ–Trung, bất chấp Nvidia phủ nhận rủi ro bảo mật. Nhân dân nhật báo yêu cầu bằng chứng rõ ràng để lấy lại niềm tin thị trường.

https://www.cnbc.com/2025/08/10/chinese-state-media-says-nvidia-h20-chips-not-safe-for-china.html

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-08-09 21:03:15

Brookfield dự báo bùng nổ hạ tầng AI thập kỷ tới với 75GW trung tâm dữ liệu, chi vượt 7 nghìn tỷ USD

Brookfield Asset Management dự báo tổng chi tiêu cho hạ tầng AI trong 10 năm tới sẽ vượt 7.000 tỷ USD, với phân bổ 4.000 tỷ USD cho chip (bao gồm nhà máy và chuỗi cung ứng), 2.000 tỷ USD cho trung tâm dữ liệu AI, 500 tỷ USD cho điện & truyền tải, và 500 tỷ USD cho công nghệ hỗ trợ khác như cáp quang, làm mát, robot.
Công ty nhấn mạnh nguy cơ “xây dư thừa” là rất thấp do nhu cầu AI đang tăng nhanh ở nhiều lĩnh vực ứng dụng.
Công suất trung tâm dữ liệu AI sẽ tăng từ khoảng 7GW (2024) lên 15GW cuối 2025, và bổ sung thêm 75GW trong thập kỷ tới, đạt 82GW vào 2034 – gấp hơn 10 lần so với 2024.
Số lượng GPU toàn cầu dự kiến tăng từ khoảng 7 triệu (2024) lên 45 triệu vào 2034, chủ yếu phục vụ inference (ước 75% nhu cầu tính toán AI vào 2030).
Brookfield nhận định sự gia tăng của AI agents phức tạp sẽ khiến nhu cầu inference bùng nổ, thay đổi thiết kế trung tâm dữ liệu để tối ưu cho lưu lượng inference lớn, không chỉ tập trung vào huấn luyện.
Dịch vụ GPU-as-a-service sẽ tăng trưởng mạnh từ 30 tỷ USD (2025) lên hơn 250 tỷ USD (2034) khi nhiều công ty muốn thuê GPU thay vì đầu tư phần cứng.
Công nghệ thay đổi nhanh đòi hỏi trung tâm dữ liệu AI phải có thiết kế mô-đun, nâng cấp nhanh hệ thống điện và làm mát theo tiến bộ chip.
Brookfield đang đẩy mạnh đầu tư, bao gồm dự án 10 tỷ USD xây trung tâm dữ liệu AI tại Thụy Điển công bố tháng 6 vừa qua.

📌 Brookfield dự báo thập kỷ tới sẽ chi hơn 7.000 tỷ USD cho hạ tầng AI, trong đó 2.000 tỷ USD cho 75GW trung tâm dữ liệu mới, nâng tổng công suất lên 82GW vào 2034. GPU toàn cầu sẽ đạt 45 triệu, 75% phục vụ inference. Dịch vụ GPU-as-a-service tăng từ 30 tỷ USD lên 250 tỷ USD, đòi hỏi thiết kế mô-đun để thích ứng công nghệ nhanh.

https://www.datacenterdynamics.com/en/news/brookfield-next-decade-will-see-75gw-of-ai-data-centers-built-total-ai-infrastructure-spend-to-pass-7-trillion/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-08-09 00:40:14

Siêu trung tâm dữ liệu AI “khát điện”: hiệu suất cao có cứu nổi lưới điện?

Nhu cầu AI và điện toán đám mây đang thúc đẩy làn sóng xây dựng trung tâm dữ liệu tiêu thụ điện lớn, tạo áp lực lên lưới điện và môi trường.
Thay vì chỉ mở rộng nguồn điện, một số chuyên gia và công ty tập trung cải thiện hiệu suất trung tâm dữ liệu — tỷ lệ điện cung cấp cho thiết bị tính toán so với phần mất mát cho làm mát, chiếu sáng và hạ tầng phụ trợ.
Steven Carlini (Schneider Electric) nhận định: dùng điện hiệu quả hơn giúp tăng năng lực xử lý mà không cần mở rộng hạ tầng quá lớn.
Công nghệ làm mát bằng chất lỏng đang thay thế làm mát bằng không khí, đặc biệt với chip AI nhiệt độ cao. Amazon áp dụng “cold plate” đặt trực tiếp lên chip, chất lỏng hấp thu và tản nhiệt; AI hỗ trợ điều chỉnh nhiệt độ theo thời gian thực.
Các hãng như Nvidia và Groq cải thiện hiệu suất chip, giúp hiệu năng tính toán trên mỗi watt tăng trung bình 1,34 lần/năm (2019–2025).
AmberSemi phát triển bán dẫn giảm thất thoát điện tới 15%, nhờ “vertical power delivery” cấp điện từ phía dưới chip, thay vì truyền ngang.
Mỗi 1% điện thất thoát tương đương 460 triệu USD/năm tại Mỹ.
Nghiên cứu của Duke University: lưới điện Mỹ có thể hỗ trợ thêm 76 GW tải mới nếu các trung tâm dữ liệu linh hoạt giảm tải 0,25% thời gian vận hành, ví dụ chuyển sang nguồn tại chỗ hoặc hoãn tác vụ không gấp. Google đã ký thỏa thuận thử nghiệm với hai công ty điện.
Rào cản: doanh nghiệp ít động lực áp dụng “large load flexibility” nếu chưa xảy ra khủng hoảng điện nghiêm trọng.
Nguy cơ nghịch lý Jevons: tăng hiệu suất có thể khiến xây thêm trung tâm dữ liệu và mô hình AI mạnh hơn, làm tổng tiêu thụ điện tăng thay vì giảm.

📌 Các hyperscaler như Amazon, Google đang tối ưu làm mát, chip và quản lý điện để giảm áp lực lên lưới điện, tiềm năng tiết kiệm hàng trăm triệu USD mỗi 1% hiệu suất cải thiện. Nvidia và Groq cải thiện hiệu suất chip, giúp hiệu năng tính toán trên mỗi watt tăng trung bình 1,34 lần/năm (2019–2025). Tuy nhiên, nghịch lý Jevons và nhu cầu AI không ngừng tăng có thể khiến tổng điện tiêu thụ vẫn leo thang, đòi hỏi giải pháp kết hợp công nghệ và quản lý nhu cầu điện.

https://www.ft.com/content/cb970062-5311-477b-8e43-93b67c2fd79c

How more efficient data centres could unlock the AI boom

Efficiency is becoming a bigger priority as tech companies confront strained energy resources

Martha Muir in Middletown, Ohio

Published16 minutes ago

This article is an on-site version of our Energy Source newsletter. Premium subscribers can sign up here to get the newsletter delivered every Tuesday and Thursday. Standard subscribers can upgrade to Premium here, or explore all FT newsletters

Hello from the Buckeye state.

The walls are closing in on Narendra Modi, as US President Donald Trump pressures the Indian prime minister to stop feeding oil into an economy propped up on cheap Russian crude. My colleagues Andres Schipani, Krishn Kaushik and Anastasia Stognei outline the bind Modi finds himself in, caught between the two old cold war foes.

And trouble continues at BP, which expects to axe 6,200 jobs as it launches its second business review in six months. The cuts are part of a broader makeover for the company, which has slashed spending on clean energy and increased its oil production.

Finally, Trump’s sacking of Bureau of Labor Statistics commissioner Erika McEntarfer was just the latest blow to an agency that says funding and staff cuts have hampered its ability to collate vital reports on the world’s largest economy.

Today we take a deep dive into data centre efficiency, which experts say could mitigate the need for massive grid upgrades and additions. — Martha

How AI ‘hyperscalers’ are boosting data centre efficiency

Here is a much discussed problem in the US build-out of energy infrastructure to power artificial intelligence.

Booming demand for AI and cloud computing is driving the construction of power-hungry data centres. The sprawling campuses that “hyperscalers” such as Meta, Google and Amazon are building will either siphon power from the grid or generate power on-site.

In both cases, the play is to supply more energy to meet growing demand.

But that requires massive capital investment (which critics say will raise costs for households and businesses); the expansion of reliable but polluting energy sources such as gas; bets on moonshot technologies including small modular nuclear reactors; and wading through a labyrinthine permitting process.

Some researchers and companies think there’s another way: boosting data centre efficiency, thus reducing the need to build out the grid.

Data centre efficiency refers to the amount of energy that goes into powering computing equipment, versus what’s lost to cooling systems, lighting and other supporting infrastructure.

While hyperscalers have always had an incentive to care about data centre efficiency, Steven Carlini, Schneider Electric’s vice-president of innovation and data centre solutions, says it’s becoming a bigger priority as tech companies battle to win the AI race while balancing strained energy resources.

“There’s a limited amount of available power, but the more efficiently they can use that power, the more capacity they can build,” he said.

Innovations in technologies such as liquid cooling are helping to achieve these aims.

Chips generate heat as they cycle through the trillions of calculations that power large language models and image recognition. Until recently, air cooling systems were used to mitigate this, but they are becoming less economical as AI becomes more advanced. Since liquids are denser, liquid cooling systems are increasingly being adopted.

Hyperscalers such as Amazon are switching to use custom-made liquid cooling systems, in which a “cold plate” is placed directly on top of its chips and a liquid that absorbs and removes heat is run through. The system will be put into use this summer across Amazon’s data centres.

As data centres grow bigger and bigger — and harder to keep optimally cool — they are starting to use AI tools to tweak temperatures in real time.

“You don’t want to overcook the liquid going into the chips, so we’re always adjusting and optimising the temperatures,” said Carlini.

“That’s new because running at these types of densities, at this scale, is really challenging for the industry.”

Other efforts involve maximising the efficiency of the chips and power management hardware, driven by innovation from companies such as Nvidia and Groq.

An April paper from the Rand Corporation and Epoch AI found that across 500 “AI supercomputers” there was a year-on-year 1.6-times improvement in performance per chip from 2019 to 2025, driven primarily by the adoption of new models. The supercomputers also became more energy efficient, with computational performance per watt increasing by 1.34 times per year.

AmberSemi is building semiconductors that it says can cut energy waste by 15 per cent.

Electricity enters data centres at high voltages, which need to be stepped down to a level that the equipment can safely use. As power is transferred to the motherboard, the main circuit board inside a computer or server, as much as 50 per cent can be lost, according to chief executive Thar Casey.

The company uses “vertical power delivery” to supply chips with power from underneath, instead of moving it laterally, which helps conserve energy.

Casey says the market for data centre efficiency technologies will only grow.

“Each 1 per cent of energy loss represents about $460mn per year,” he said. “We’re talking about serious money, and that’s only in the US.”

Konstantin Pilz, an author of the Rand-Epoch AI report, says the biggest efficiency gains will come from chips, but these advancements are becoming increasingly hard to achieve as data centres demand more and more powerful semiconductors to support their AI models.

“Chips are the main thing that could improve and energy efficiency, which companies are aware of,” he said. “But they’re still very power hungry.”

Researchers at Duke University caused a stir earlier in the year with a paper on large load flexibility, the ability of data centres to reduce their power usage — for instance by switching to on-site power sources or deprioritising non-urgent tasks — at times of low demand or when the grid is under strain.

The researchers found that US grids could support at least 76 gigawatts of new load with an annual load curtailment rate of 0.25 per cent (meaning new loads are reduced for 0.25 per cent of their operating hours).

“Necessity is the mother of invention,” said report author Tyler Norris. “We have extreme supply chain constraints right now, so either [the demand] will disappear entirely or it can be more flexible.”

The primary critique of the study is that while it is theoretically workable, private companies have little incentive to lean into large load flexibility. Since AI models are not at full maturity, and hyperscalers are pouring massive amount of capex into their data centres, it might take an exacerbated power crunch for it to gain traction.

Still, Google is making moves in this direction. On Monday it announced agreements with two utilities, Indiana Michigan Power and Tennessee Valley Authority, to vary energy use at data centres in their purview.

Its an encouraging sign of hyperscaler interest, although some of the details are hazy.

If this all sounds good, there’s one rub: Jevons paradox.

This theory says that increased efficiency leads to more overall consumption of a resource, rather than less.

If data centres manage to reduce their overall power usage, companies may just build more and develop increasingly powerful models.

Pilz points out that we lack accurate economic modelling of how efficiency tracks with data centre demand, but says he’s “sceptical” that it provides significant downward pressure.

“If I’m using ChatGPT and I have the choice between the most advanced model or like a generation behind, I prefer to use the most advanced model,” he said. “And I think that’s why, despite these efficiency improvements, we still see this large increase in compute and power demand.” (Martha Muir)

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-08-09 00:04:41

OpenAI dựng “siêu nhà máy AI” Project Stargate ở Na Uy với 100.000 GPU Nvidia và 1 tỷ USD

OpenAI khởi động Project Stargate tại Narvik, Na Uy, tránh các trung tâm dữ liệu truyền thống như Đức, Pháp hay Anh.
Lý do chọn Narvik: giá điện rẻ, nguồn thủy điện dồi dào, khí hậu mát tự nhiên và dung lượng truyền tải điện chưa được khai thác hết.
Giai đoạn đầu công suất 20MW, vốn đầu tư khoảng 1 tỷ USD, hướng tới mở rộng lên 520MW.
Hạ tầng sẽ chạy hoàn toàn bằng năng lượng tái tạo, sử dụng hệ thống làm mát trực tiếp vào chip (direct-to-chip liquid cooling) và tái sử dụng nhiệt thải cho các dự án carbon thấp địa phương.
Dự án là liên doanh giữa Nscale (hạ tầng AI) và tập đoàn công nghiệp Aker, cả hai cam kết nguồn vốn lớn.
Lắp đặt 100.000 GPU Nvidia, tối ưu cho xử lý tác vụ AI và hiệu suất CPU – storage cao.
OpenAI sẽ là khách hàng tiêu thụ chính, phần công suất dư sẽ phân phối cho Anh, các nước Bắc Âu và Bắc Âu mở rộng.
Sam Altman nhấn mạnh châu Âu cần nhiều năng lực tính toán hơn để hỗ trợ nhà phát triển, nhà nghiên cứu, startup và giới khoa học.
Đây được xem là “AI Gigafactory” đầu tiên ở châu Âu, đánh dấu bước ngoặt chiến lược đưa Bắc Cực trở thành trung tâm AI mới của lục địa.
Tầm nhìn dài hạn gắn với việc đưa châu Âu tham gia sâu hơn vào cuộc đua hạ tầng AI toàn cầu, khi nhu cầu tính toán tăng mạnh.

📌 OpenAI đang tạo cú hích cho hạ tầng AI châu Âu với Project Stargate tại Narvik, Na Uy: 1 tỷ USD đầu tư giai đoạn đầu 20 MW, 100.000 GPU Nvidia, hướng đến công suất 520MW chạy 100% năng lượng tái tạo. Sự lựa chọn địa điểm chiến lược dựa vào giá điện rẻ, thủy điện dồi dào và hạ tầng truyền tải sẵn có, hứa hẹn biến Bắc Cực thành điểm nóng AI mới, thay đổi cán cân địa lý của ngành.

https://www.techradar.com/pro/project-stargate-hits-europe-openai-launches-giant-data-center-powered-by-100-000-nvidia-gpus-but-probably-not-in-the-country-youd-expect

Không có file đính kèm.

Nguồn tham khảo

AI mở-nguồn mở AI chips-hardware-compute 2025-08-06 23:51:01

Huawei tuyên chiến Nvidia: Mã nguồn mở CANN để phá thế độc quyền AI

Huawei tuyên bố sẽ mã nguồn mở bộ công cụ CANN (Compute Architecture for Neural Networks) – phần mềm phát triển ứng dụng cho bộ xử lý AI Ascend, nhằm tạo nền tảng thay thế cho CUDA độc quyền của Nvidia.
Chủ tịch luân phiên Eric Xu khẳng định mục tiêu là giúp CANN dễ dùng hơn và đẩy nhanh đổi mới từ cộng đồng nhà phát triển.
Huawei đang phối hợp với các công ty AI hàng đầu Trung Quốc, trường đại học và viện nghiên cứu để xây dựng hệ sinh thái nguồn mở Ascend.
CANN lần đầu ra mắt năm 2018 và phiên bản mới nhất CANN 8.0 được giới thiệu vào tháng 9/2024. Huawei gọi đây là "nền tảng cơ bản" cho hệ sinh thái Ascend.
Động thái này diễn ra sau khi Cục Quản lý Không gian mạng Trung Quốc (CAC) mở điều tra chip H20 của Nvidia – một dòng GPU được thiết kế riêng cho thị trường Trung Quốc để tuân thủ các hạn chế xuất khẩu của Mỹ.
CAC lo ngại về vấn đề bảo mật nghiêm trọng và khả năng bị điều khiển từ xa của H20. Nvidia phủ nhận có "cửa sau" trong chip và khẳng định ưu tiên an ninh mạng.
Năm ngoái, Nvidia cập nhật điều khoản CUDA, cấm chạy CUDA trên GPU của bên thứ ba thông qua lớp dịch mã. Điều này càng làm nổi bật vai trò của nền tảng mã nguồn mở như CANN.
Một tuần trước, hơn 10 công ty bán dẫn và AI Trung Quốc, bao gồm StepFun, SiliconFlow, Biren, Cambricon... đã thành lập Liên minh Đổi mới Hệ sinh thái Model-Chips, nhằm thúc đẩy dùng chip trong nước cho dự án AI.
CEO Nvidia, Jensen Huang, từng nói Nvidia vẫn dẫn trước một thế hệ công nghệ, nhưng thừa nhận Huawei có khả năng mở rộng mạnh nếu lệnh cấm của Mỹ tiếp tục.

📌 Huawei chính thức mã nguồn mở CANN, tạo đòn tấn công trực diện vào CUDA của Nvidia giữa bối cảnh Trung Quốc đẩy mạnh tự chủ AI. Bộ công cụ giúp mở rộng hệ sinh thái Ascend, thúc đẩy phát triển phần mềm nội địa và giảm phụ thuộc vào GPU Mỹ. Trong khi đó, Cục Quản lý Không gian mạng Trung Quốc điều tra chip H20 của Nvidia vì lo ngại bảo mật, khiến vị thế Nvidia tại Trung Quốc càng lung lay.

https://www.scmp.com/tech/tech-war/article/3320852/tech-war-huawei-open-source-ai-chip-toolkit-take-nvidias-proprietary-platform

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-08-05 22:45:41

Trung tâm dữ liệu AI có thể kéo sập kinh tế Mỹ nếu bong bóng nổ tung?

Kinh tế Mỹ hiện khá ảm đạm, ngoại trừ điểm sáng lớn: cơn sốt xây dựng trung tâm dữ liệu AI, với chi tiêu khổng lồ từ các ông lớn công nghệ như Google, Meta, Microsoft và Amazon.
Tính đến giữa 2025, chi tiêu vốn cho AI của nhóm "Magnificent 7" đạt 102,5 tỷ USD, vượt cả đầu tư viễn thông giai đoạn dot-com năm 2000 (1,2% GDP).
Inference (tính toán suy luận) chiếm phần lớn chi phí vận hành AI, khiến nhu cầu "compute" tăng vọt.
Các công ty không rõ liệu có sinh lời nhưng vẫn đổ tiền xây dựng trung tâm dữ liệu vì kỳ vọng AI sẽ thống trị tương lai. Ví dụ: Meta đang vay 30 tỷ USD từ quỹ tín dụng tư nhân như Apollo, Carlyle.
Các nguồn tài trợ chính gồm: dòng tiền nội bộ, phát hành trái phiếu, vốn mạo hiểm, công cụ tài chính phức tạp (SPV, lease), và đặc biệt là tín dụng tư nhân (private credit).
Private credit là loại hình vay nợ rủi ro, ít minh bạch, hiện chiếm phần lớn tài trợ cho hạ tầng AI. Tăng trưởng mạnh khiến nó trở thành mối nguy tiềm ẩn cho hệ thống ngân hàng.
Từ 2013 đến 2025, tỷ trọng khoản vay ngân hàng cho các quỹ tín dụng tư nhân tăng từ 1% lên 14%. Nếu AI thất bại, các khoản vay có thể cùng vỡ nợ, tạo "rủi ro đuôi" (tail risk).
Ngành bảo hiểm nhân thọ cũng ngày càng giống "ngân hàng ngầm", dùng tiền từ nhà đầu tư để cho các quỹ private credit vay. Rủi ro vượt cả mức của trái phiếu subprime năm 2007.
Các chuyên gia lo ngại nếu bong bóng AI vỡ, ngân hàng và công ty bảo hiểm có thể lâm nguy, dẫn đến suy thoái tài chính lan rộng.
CEO JP Morgan, Jamie Dimon, đã cảnh báo private credit có thể là "chất nổ" của cuộc khủng hoảng tài chính tiếp theo, dù chính ngân hàng này cũng đang gia nhập thị trường.

📌 Mỹ đang sống trong cơn sốt hạ tầng AI với đầu tư vượt cả thời dot-com, nhưng sự phụ thuộc ngày càng lớn vào tín dụng tư nhân không minh bạch để tài trợ trung tâm dữ liệu khiến hệ thống tài chính đối mặt rủi ro hệ thống. Nếu bong bóng AI vỡ, hậu quả không chỉ là mất mát cổ phiếu mà có thể kéo theo khủng hoảng tài chính kiểu 2008.

https://asiatimes.com/2025/08/will-ai-data-centers-crash-the-us-economy/#

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-08-05 22:40:45

Trung Quốc không muốn dùng chip Huawei nhưng sẽ buộc phải chọn nếu Mỹ tính sai bước

Mỹ hiện đang vượt Trung Quốc gấp 10 lần về năng lực tính toán AI, nhờ đầu tư hạ tầng và tiếp cận chip tiên tiến từ Nvidia và AMD.
Trong khi đó, Trung Quốc đang gặp khó khăn nghiêm trọng do kiểm soát xuất khẩu của Mỹ đối với chip AI và thiết bị sản xuất bán dẫn.
Dù Huawei cung cấp dòng chip Ascend 910B/910C, các công ty lớn như ByteDance, Alibaba, Tencent vẫn ưu tiên chip Nvidia H20, kể cả bản bị giảm hiệu năng.
Năm 2024, Trung Quốc nhập khoảng 1 triệu chip Nvidia H20, so với chỉ 450.000 chip Ascend 910B của Huawei.
Các lý do chính khiến Huawei bị từ chối:
- Hiệu suất thua kém về băng thông và bộ nhớ.
- Thiếu hệ sinh thái phần mềm CUDA như của Nvidia.
- Hệ thống phần mềm CANN và MindSpore của Huawei kém ổn định, dễ lỗi và quá mới.
- Huawei là đối thủ cạnh tranh trực tiếp trong lĩnh vực điện toán đám mây và AI tại Trung Quốc.
Huawei đang đạt tiến bộ đáng kể: hệ thống CloudMatrix 384 vượt Nvidia GB200 NVL72 về hiệu năng và băng thông, dù tiêu tốn nhiều năng lượng và chi phí hơn.
Huawei cũng đã tăng trưởng hệ sinh thái nhà phát triển Ascend gấp 10 lần, và các công ty như DeepSeek, ByteDance, Ant Group đã bắt đầu thử nghiệm chip Huawei.
Cambricon, một công ty AI chip khác, tăng trưởng 40 lần doanh thu quý I và nhận đơn hàng lớn từ ByteDance.
Nvidia thừa nhận thị phần tại Trung Quốc đã giảm từ 95% xuống còn 50%.
Giải pháp thông minh cho Mỹ: đặt ngưỡng hiệu năng AI chip cho phép bán sang Trung Quốc, cao hơn chip nội địa Trung Quốc để giữ khách hàng, nhưng thấp hơn so với chip dành cho Mỹ nhằm duy trì lợi thế cạnh tranh.
Việc cập nhật ngưỡng hiệu năng hàng năm giúp phản ứng linh hoạt trước các bước tiến bất ngờ từ Trung Quốc mà không làm mất ổn định thị trường.

📌 Mặc dù Huawei đang bị các công ty Trung Quốc tránh né vì hiệu suất và rủi ro địa chính trị, nếu Mỹ không tinh chỉnh chính sách kiểm soát chip AI hợp lý, một bước chuyển toàn diện sang chip nội địa như Huawei là điều có thể xảy ra. Giải pháp cân bằng giữa ngăn chặn và giữ chân là chìa khóa để Mỹ bảo vệ vị thế dẫn đầu trong cuộc đua AI toàn cầu.

https://foreignpolicy.com/2025/08/04/china-chips-controls-nvidia-ai-huawei/

Leashing Chinese AI Needs Smart Chip Controls

Firms don’t want Huawei’s domestically produced alternatives—but might have no choice.

By Kyle Chan, a postdoctoral researcher in the Sociology Department at Princeton University and an adjunct researcher at the Rand Corporation, and Ray Wang, a Washington-based analyst focused on the semiconductor and AI industry in China, South Korea, and Taiwan.

Jensen Huang, co-founder and CEO of Nvidia, speaks during a news conference in Taipei on May 21. I-Hwa Cheng AFP via Getty Images

August 4, 2025, 11:31 AM View Comments (0)

China’s stunning achievements in AI have one glaring weak spot: access to compute—the raw processing power that fuels AI and relies on large volumes of advanced semiconductors. The U.S. currently has a tenfold advantage over China in total compute capacity, a gap that may only widen over time. U.S. tech firms are pouring billions of dollars into new data centers and can reap the benefits of the latest chip advancements from Nvidia and AMD or their own self-developed AI chips.

Meanwhile, the performance and volume of foreign AI chips that Chinese firms can obtain have gone down over time due to increasingly stringent U.S. export controls. Chinese tech leaders such as Tencent, Baidu, and DeepSeek have called out compute constraints as a key bottleneck to faster AI development.

Huawei’s domestically produced AI chips, known as the Ascend series, might seem like the obvious solution to China’s compute challenges. But there’s a catch: Chinese tech firms don’t want to use Huawei’s chips, which lag behind their foreign counterparts, for training their AI models. In 2024, Chinese companies bought around 1 million Nvidia H20 chips compared with an estimated shipment of 450,000 Huawei Ascend 910B chips.

Only a handful of state-backed companies in China have used Huawei chips to train their models, including iFlytek, SenseTime, and China Mobile. Chinese companies are dragging their feet on switching to domestic AI chips despite pressure from Chinese central government agencies to do so.

Chinese AI developers overwhelmingly prefer using Nvidia chips—even severely performance-degraded ones—and go to great lengths to access them. Many of China’s top AI models today are still trained on Nvidia’s hardware, including DeepSeek’s V3 model and Moonshot’s Kimi K2 model. In anticipation of the U.S. ban on Nvidia’s H20 chips, ByteDance, Alibaba, and Tencent rushed to spend $16 billion to stockpile roughly 1.3 million to 1.6 million H20 units.

At the end of 2024, ByteDance had planned to spend $7 billion to access Nvidia chips on servers outside of China. Chinese tech companies have been scouring black markets across Asia as well as e-commerce sites to acquire banned Nvidia chips for as much as double their normal pricedouble the price. Chinese buyers have even resorted to buying Nvidia’s RTX gaming chips as substitutes, even though they are not designed for AI workloads, and smuggling hard drives full of data out of the country to train models on servers outside of China.

Why are China’s AI developers so reluctant to switch from Nvidia to Huawei, even as their access to Nvidia chips becomes increasingly constrained?

First, Nvidia’s degraded chips for sale to China still outperform Huawei’s chips in some important dimensions. Huawei’s Ascend 910B chips use older HBM2E memory technology, offering only two-thirds of the memory capacity and 40 percent of the bandwidth of Nvidia’s H20 chips.

Huawei’s newer Ascend 910C chips, which are ramping up production this year, offer 80 percent of the H20’s bandwidth but still use the older HBM2E memory standard that is two generations behind the most advanced AI chips. This gap in memory performance is particularly important given the rise of reasoning models and inference, where memory bandwidth plays a vital role.

A second key reason why Chinese tech companies can’t easily quit Nvidia is the same reason American tech companies can’t, either: CUDA. Nvidia’s parallel computing platform, launched in 2006, has accumulated and is tightly integrated with PyTorch, the dominant AI framework, creating a mature software ecosystem that locks developers into Nvidia’s AI systems.

For Chinese tech firms, switching away from Nvidia means rewriting code, abandoning this industry-leading infrastructure, and losing access to the applications in CUDA libraries built up over years by global developers. Huawei’s alternatives—its CANN platform and MindSpore framework, launched in 2018 and 2019—are newer, less mature, and plagued by technical issues including bugs, crashes, and overheating.

With a far smaller AI hardware user base than Nvidia’s systems, Huawei lacks the high-volume, real-world feedback from major customers needed to rapidly refine its chips and software. As a result, Huawei’s AI solutions are unable to take advantage of the kind of iterative optimization that made China a global leader in other industries.

While access to Nvidia chips is becoming increasingly difficult, the supply of Huawei’s chips remains both constrained and uncertain. U.S.-led export controls on semiconductor manufacturing equipment to China have limited the country’s chipmaking capabilities.

In particular, Huawei and SMIC have been struggling to ramp up production of advanced chips at the 7-nanometer process level or below. A lack of access to extreme ultraviolet lithography (EUV) machines from ASML and U.S. tools for key tasks such as etching and deposition have made it difficult for SMIC to manufacture advanced chips precisely and reliably, keeping its production yield far below industry leader TSMC.

While SMIC is making steady progress and Huawei is on track to sell over a million Ascend dies this year, Huawei also illegally procured more than 2 million of TSMC’s logic dies, a core chip component, for its Ascend 910B and 910C chips in 2024. Ironically, because Huawei is already heavily sanctioned, it faces little punishment for skirting export controls in this way.

Chinese companies are also wary of the additional commercial and geopolitical risks involved with Huawei, which has been a frequent target of the U.S. government for years. For example, the U.S. Department of Commerce warned in May that using Huawei chips “anywhere in the world” would violate U.S. export control rules before later adjusting its announcement.

Huawei is not only a chip supplier to Chinese tech companies but also a powerful competitor. Huawei is China’s second-largest cloud service provider and has developed its own open-source Pangu family of AI models. Other Chinese tech companies are jostling with Huawei to provide cloud services not just within China but globally as well—making Huawei’s chips an unpopular option for firms competing in the same space.

However, this could all change if the U.S. makes the wrong decisions.

While Huawei’s chips have lower bandwidth memory performance than Nvidia’s H20 chips, Huawei’s 910B and 910C chips already offer greater total processing performance (TPP) and better energy efficiency (TPP/watt) than the H20. Far from being a “powerful chip” as some have claimed, the H20 actually has worse computational performance and energy efficiency than Nvidia’s older A100 chips, launched back in 2020. Moreover, Huawei has been able to improve the computational performance of its Ascend chips, even after switching production from Taiwanese chip manufacturer TSMC to China’s own SMIC following U.S. export controls.

Perhaps more importantly, Huawei has been making significant progress at the level of AI computing systems. Huawei recently unveiled its CloudMatrix 384 system, made up of 384 of Huawei’s latest 910C chips and a novel all-optical networking approach. According to SemiAnalysis, Huawei’s new CloudMatrix system outperforms Nvidia’s state-of-the-art GB200 NVL72 system on key dimensions, such as compute power (how fast the chip can process large volumes of data), memory bandwidth, and integrated networking.

While Huawei’s new system is a lot more costly and energy-intensive than Nvidia’s counterpart, which may limit customer adoption, it marks a striking advancement in system-level performance, which may be even more important than individual chip performance for scaling up large AI compute clusters.

In a recent technical paper, Huawei has already proved that its new CloudMatrix system can be successfully used to train advanced AI models. The pricing and energy issues will likely be manageable for Huawei as it continues to invest heavily in R&D and receive significant state support.

As Huawei’s AI systems continue to improve, U.S. export control policies must be carefully calibrated to avoid pushing China’s AI industry too far. If China’s domestic AI chips continue to improve, while U.S. chips available in China are further downgraded by export controls, there will be a crossover point where the performance of Chinese chips clearly exceeds that of American chips available in China.

The crucial tipping point could be if China’s largest tech companies, such as Alibaba, Tencent, and ByteDance, throw their formidable resources toward working with Chinese AI chipmakers. This would kick off a positive feedback loop for China’s AI chipmakers, particularly Huawei, building up the software libraries and tools for creating a complete Chinese AI hardware-software ecosystem. Once this process is underway, it would also mark a point of no return for American AI chipmakers like Nvidia in the China market.

There are already some signs of this potential shift. DeepSeek and ByteDance are experimenting with using Huawei’s AI chips to run their AI models. Ant Group, a spinoff of Alibaba, is even testing the use of Huawei’s chips for model training. Huawei’s Ascend developer community has grown nearly tenfold in the past four years, though it still remains far smaller than Nvidia’s.

Other Chinese AI chipmakers besides Huawei are making progress as well, including Cambricon, Biren, Moore Threads, Enflame, and Hygon. Cambricon saw its first-quarter revenue surge more thanforty‑foldfortyfold last year and received a large order for its AI chips from ByteDance, Cambricon’s revenue is forecasted to grow 3.7 times to 5.5 billion yuan this year according to Goldman Sachs. Nvidia’s CEO, Jensen Huang, has said that Nvidia’s market share in China has declined from 95 percent to 50 percent—a claim supported by other credible analysis.

The U.S. needs a more sophisticated approach to export controls. The reversal of the H20 chip ban by the Trump administration was a step in the right direction. At the same time, the White House’s new AI action plan correctly recognizes that winning the AI race with China depends on making the U.S. tech stack, including its AI chips, the dominant platform for global AI development.

Semiconductor export controls are not as simple as tightening the valve on a tap. China’s AI chip dilemma is not just a hardware problem but an ecosystem one. Huawei now has access to many of the key resources it needs to develop advanced AI chips, including financing and talent. But it’s missing a large and dedicated customer base that is committed to co-refining the software and hardware Huawei offers.

A smart approach to export controls would focus on setting a performance threshold for AI chips that can be sold to China based on a window between U.S. and Chinese hardware capabilities. The performance threshold should be high enough to outperform China’s domestic hardware options to ensure Chinese developers remain on U.S. platforms. At the same time, it should be low enough to maintain a significant performance gap with hardware systems available to American developers.

Ideally, this performance threshold would include a buffer, such as a 50 percent performance advantage over Chinese hardware systems on key metrics, in anticipation of improvements in Chinese hardware offerings. A regular yearly update, with ad hoc changes for unexpected developments, would likely be sufficient to adjust for advances made in Chinese AI chips while providing enough policy stability for industry participants.

The overarching policy goal is clear: Ensure the U.S. continues to lead the world in AI. By constraining China’s access to cutting-edge chips without pushing Chinese AI developers to make the leap to China’s own domestic chips, the U.S. can use export controls to help make this a reality.

Không có file đính kèm.

Nguồn tham khảo

AI pháp lý-quản trị-chủ quyền AI chips-hardware-compute 2025-08-05 20:40:02

Mỹ xem xét tích hợp công nghệ định vị vào chip AI để ngăn chặn buôn lậu và kiểm soát công nghệ

Mỹ đang tích cực xem xét việc trang bị cho các chip AI khả năng định vị chính xác hơn nhằm ngăn chặn việc buôn lậu và kiểm soát luồng công nghệ, theo Michael Kratsios – Giám đốc Văn phòng Chính sách Khoa học và Công nghệ Nhà Trắng.
Ý tưởng này là một phần rõ ràng trong kế hoạch hành động AI do cựu Tổng thống Donald Trump công bố, nhắm đến việc duy trì vị thế công nghệ của Mỹ và hạn chế Trung Quốc tiếp cận chip cao cấp.
Kratsios cho biết có thể có những thay đổi về phần mềm hoặc phần cứng đối với chip để tăng khả năng theo dõi vị trí – điều đang được thảo luận cùng các công ty trong ngành.
Trung Quốc đã triệu tập đại diện Nvidia để làm rõ các lo ngại về an ninh liên quan đến chip H20 và khả năng theo dõi của Mỹ. Nvidia khẳng định không có "cửa hậu" (backdoors) trong sản phẩm của họ.
Trong một diễn đàn tại Hàn Quốc, Kratsios kêu gọi các quốc gia trong khu vực châu Á - Thái Bình Dương ưu tiên công nghệ Mỹ, đồng thời tiết lộ chính phủ Mỹ chuẩn bị cung cấp hỗ trợ tài chính để thúc đẩy xuất khẩu công nghệ AI sang các nước đồng minh.
Một trụ cột quan trọng khác là xây dựng hạ tầng AI tại Mỹ để các đột phá công nghệ tiếp theo sẽ dựa trên nền tảng do Mỹ cung cấp.
Trung Quốc đã phản ứng gay gắt, gọi các nỗ lực này là giám sát và tìm cách kìm hãm sự phát triển công nghệ nước này, nhất là các công ty như Huawei hay DeepSeek.
Mặc dù đang hạn chế xuất khẩu, Mỹ cũng đề xuất dỡ bỏ lệnh cấm chip H20 như một phần trong thỏa thuận thương mại nhằm bảo đảm nguồn cung nam châm đất hiếm từ Trung Quốc.
Kratsios nói ông chưa từng có cuộc thảo luận cá nhân với Nvidia hay AMD về tích hợp định vị, nhưng Washington vẫn tập trung vào ngăn chặn việc buôn lậu công nghệ.
Ông cũng chỉ trích kế hoạch AI toàn cầu của Trung Quốc, cho rằng mỗi quốc gia nên tự thiết lập quy định riêng. Mô hình của Mỹ – ưu tiên đổi mới – sẽ hấp dẫn hơn so với cách tiếp cận tập trung vào kiểm soát.

📌 Mỹ đang cân nhắc tích hợp công nghệ định vị vào chip AI để ngăn buôn lậu sang Trung Quốc, nằm trong kế hoạch AI của Trump. Căng thẳng gia tăng khi Trung Quốc triệu tập Nvidia về lo ngại an ninh. Dù chưa bàn cụ thể với AMD hay Nvidia, Mỹ quyết theo đuổi kiểm soát công nghệ, song song với mở cửa thương mại chiến lược như chip H20 và nam châm đất hiếm.

https://www.bloomberg.com/news/articles/2025-08-05/us-explores-better-location-trackers-for-ai-chips-official-says

US Explores Location Trackers for AI Chips, Official Says

Kratsios: US Is Exploring Ways to Track Flow of AI ChipsBloomberg: The Asia Trade”.
By Yoolim Lee, Haslinda Amin, and Haidi Lun
August 5, 2025 at 1:28 AM UTC
Updated on August 5, 2025 at 9:15 AM UTC

Save

Translate

Listen
2:44
Takeaways by Bloomberg AI

Hide
The US is exploring ways to equip chips with better location-tracking capabilities, according to a senior official.
Washington has a broader plan to curtail smuggling and ensure American technology remains dominant, which includes working with the industry to monitor the movements of sensitive components.
Michael Kratsios, director of the White House Office of Science and Technology Policy, said there is discussion about making software or physical changes to chips to do better location-tracking, which was explicitly included in the US AI action plan.
The US is exploring ways to equip chips with better location-tracking capabilities, a senior official said, underscoring Washington’s effort to curtail the flow of semiconductors made by the likes of Nvidia Corp. to China.
Washington has espoused working with the industry to monitor the movements of the sensitive components, part of a broader plan to curtail smuggling and ensure American technology remains dominant. Last week, Beijing summoned Nvidia representatives to discuss US efforts around location-tracking and other alleged security risks related to its H20 chips.
“There is discussion about potentially the types of software or physical changes you could make to the chips themselves to do better location-tracking,” said Michael Kratsios, one of the architects of a US AI action plan unveiled by Donald Trump last month.
“That is something we explicitly included in the plan,” the White House Office of Science and Technology Policy director told Bloomberg Television on Tuesday.
Read More: Trump Signs AI Orders, Vows US Will Win Race Over New Technology
Kratsios, who was in South Korea to attend an APEC Digital and AI Ministerial Meeting, urged the region to adopt US technology, another key pillar in the AI action plan. The government is readying federal financing tools to support AI tech exports to approved allies.
“The next trailblazing breakthroughs will be made with and on American technology, and to fully harness them, you will want America’s AI infrastructure already in place,” he told forum delegates on Tuesday.
Trump’s blueprint has provoked a backlash in Beijing, which for years railed against alleged US surveillance and Washington’s efforts to curtail its tech sector. The Chinese government is particularly sensitive to semiconductor sanctions designed to counter Huawei Technologies Co. or rising AI developers such as DeepSeek.
Read More: China Summons Nvidia to Discuss Security Risks of H20 Chip
Trump officials recently pledged to lift export restrictions on the H20 to China as part of a trade deal they say will secure sales of rare-earth magnets to the US.
But Washington is also focused on curtailing the smuggling of chips. Kratsios said during the interview with Bloomberg Television he’s not had conversations “personally” with either Nvidia or Advanced Micro Devices Inc. about exploring location-tracking technology. Last week, Nvidia said it does not have “backdoors” in its chips.
Kratsios also took aim at China’s own AI action plan, which involves forming a global organization to devise governance and technology standards.
“We believe each country should set their own destiny on how they think about regulating artificial intelligence,” he told Bloomberg Television. “The US model, which puts innovation first, will be the most attractive.”

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-08-05 12:56:29

AI không chỉ là mã lệnh hay lý thuyết – mà là một câu chuyện vật lý với chi phí khổng lồ

AI ngày càng được nhận thức như một lĩnh vực vật lý, không chỉ là phần mềm hay ý tưởng trừu tượng. Việc triển khai AI phụ thuộc vào phần cứng, tiêu thụ điện lớn và hạ tầng trung tâm dữ liệu khổng lồ.
Các kỹ sư AI giống như những ngôi sao thể thao, vì khả năng tối ưu hóa thuật toán hoặc tiết kiệm điện năng có thể giúp công ty tiết kiệm hàng tỷ đô. Ví dụ, Ilya Sutskever từng sớm nhận ra tiềm năng của mô hình transformer, giúp định hình hướng đi của OpenAI.
Mức lương của các nhà nghiên cứu AI hàng đầu đang cạnh tranh với vận động viên chuyên nghiệp. Việc cải thiện hiệu suất hoặc tiêu hao năng lượng trong đào tạo mô hình được ví như “chạy nước rút" về vật lý.
Việc mở rộng AI gây áp lực lên nguồn cung năng lượng và thiết bị điện, khiến các lĩnh vực khác bị "crowded out". Ví dụ: một nhà phát triển bất động sản không thể mở quán cà phê drive-through vì thiếu thiết bị điện – do bị chiếm dụng bởi các trung tâm dữ liệu hoặc nhà máy được trợ cấp bởi chính phủ.
Hiệu ứng "crowding out" không chỉ đến từ chi tiêu công. Ngay cả AI – một ngành đầu tư phần lớn từ tư nhân – cũng góp phần gây khan hiếm nguồn lực như điện, thiết bị và lao động.
Bài viết cũng thảo luận cách AI đang đẩy chi phí điện tăng, có thể làm giảm năng suất kinh tế trong ngắn hạn, trước khi AI mang lại lợi ích lâu dài như mong đợi.
Cuối cùng, sự già hóa dân số và nhu cầu chăm sóc sức khỏe công khiến phần lớn nguồn lực bị điều hướng, làm nổi bật căng thẳng giữa các ưu tiên kinh tế.

📌 AI không còn là thứ "trên mây": nó tiêu thụ năng lượng lớn, phụ thuộc vào hạ tầng vật lý, và làm tăng áp lực lên nền kinh tế thực. Những kỹ sư như Ilya Sutskever đang định hình tương lai AI như vận động viên siêu sao, với mức lương cực cao do khả năng tối ưu hóa mô hình. Tuy nhiên, sự đầu tư ồ ạt vào AI đang gây hiệu ứng "crowding out", chiếm dụng tài nguyên của các ngành khác – từ thiết bị điện đến lao động – trước khi mang lại hiệu quả năng suất như kỳ vọng.

https://www.bloomberg.com/news/newsletters/2025-08-04/ai-is-really-a-physical-story

AI Is Really a Physical Story
Why the sport stars analogy works.

An Amazon Web Services data center in Manassas, Virginia, US.
An Amazon Web Services data center in Manassas, Virginia, US.Photographer: Nathan Howard/Bloomberg
By Tracy Alloway and Joe Weisenthal
August 4, 2025 at 4:26 PM UTC

You’re reading the Odd Lots newsletter.
Subscribe now to get Joe and Tracy’s daily newsletter on the newest market crazes.

Subscribe
Hello and welcome to the newsletter, a grab bag of daily content from the Odd Lots universe. Sometimes it's us, Joe Weisenthal and Tracy Alloway, bringing you our thoughts on the most recent developments in markets, finance and the economy. And sometimes it's contributions from our network of expert guests and sources. Whatever it is, we promise it will always be interesting.
If you like chatting with us, check out the Odd Lots Discord, where you can hang out and talk with us and with other listeners 24/7.
In the news
In case you haven’t seen this already, Odd Lots was profiled in yesterday’s New York Times! Both of us are very grateful to the NYT for their interest, and think the author Ben Wallace did a great job of capturing the spirit of the podcast and its fans.
A huge thanks to everyone who came out to our live show and said such kind words. A big shout-out to Bloomberg for giving us the space to try new things, and our lovely producers — Carmen Rodriguez, Dashiell Bennett, and Cale Brooks — for sherpa-ing a phenomenal year for the pod.

Here’s what Tracy’s thinking about

One of the defining aspects of modern life is its abstractness. Numbers are so big now that they are difficult to grasp (Meta is worth about $1.9 trillion. That’s $1,920,000,000,000). A huge portion of the economy’s value is derived from literal intangibles — it’s all about ideas and brands. Everything is online, everything is in the cloud, everything is virtual. It’s the unbearable lightness of software as a service.
This, I must admit, is pretty much how I’ve been thinking about AI. It all still feels very theoretical, even though I know that it objectively involves a bunch of ‘real’ things like huge amounts of compute, lots of electricity, and miles of data centers.
But after recording our latest episode, in which we speak to the brilliant cohosts of the TBPN show, John Coogan and Jordi Hays, I am really starting to internalize just how physical AI actually is. It’s one reason why the “AI researchers as superstar athletes” analogy work so well. An engineer at Google might not swing a bat or run wind sprints (though never say never, I guess. Tech campuses can get weird), but their main job is nevertheless about wrangling the complicated relationship that AI has with the world’s real, physical limits.
Here’s John Coogan, for instance, describing this dynamic in relation to Ilya Sutskever, one of the most influential figures in AI today:
“… Ilya Sutskever is really, he’s the top of our list for a variety of reasons … He is both coming up with new ways to implement AI algorithms, the way you train the model, but he’s also very good at, for a long time, identifying which, the shortest path in the tech tree. So there are branches of choices that you need to make as you develop the new AI models. And he was very early, while he was at OpenAI, he identified that the transformer paper from Google, he didn’t invent that, it was at Google, but the transformer technology was extremely important and that it had the ability to do remarkable things when scaled up massively. And so he was the driving force between kind of identifying the transformer as the correct path.”
Because building out AI is so darn expensive, an AI engineer able to make incremental improvements to speed and energy consumption can literally save a company billions of dollars and justify a salary that would make Juan Soto blush. In AI, you don’t need to score home runs, you just need to make runs more efficient (I’ll get my coat).
And with energy constraints looming ever larger for future projects, those physical bottlenecks are only expected to get tighter. So while AI might feel abstract — it’s code and research citations and a bunch of different interfaces all floating around the internet — at its core, AI is also silicon, power grids, and who can best manipulate the sheer physics of scale.
What Joe is thinking about today
On Friday I wrote about the somewhat unsettling state of the US economy right now, where you have (as Tracy wrote about above) a handful of people becoming stupendously rich on AI, a much broader set of people becoming wealthier (due to their exposure to AI-adjacent stocks), and then a stagnating labor force, where it looks like the only big sources of job growth are in health care and other related social services.
To step back for a moment, a term you hear a lot in discussions of fiscal policy is “crowding out.” There's this idea that if the government is spending money on something, it’s causing some other economic activity to disappear
I’ve never really loved the phrase, or maybe I think its usage is often sloppy. After all, government spending can crowd in business activity too. A public investment in infrastructure (like the Erie Canal) might induce private investment in adjacent land. And sometimes, there’s no crowding effect at all. In the wake of the 2008 financial crisis, when private sector balance sheets were in disrepair, the lack of nominal income flowing around the economy hampered investment and hiring.
But the core idea of crowding out is not entirely without merit. In a resource-constrained environment, labor and capital that gets allocated to place ‘X’ may mean less labor and capital to place ‘Y.’ An episode of the podcast I think about all the time was when we talked to real estate developer Chris Hatch about how he couldn’t open up drive through coffee locations because of the scarcity of electrical gear (which was probably a result of both the data center boom as well as new factories subsidized by the Inflation Reduction Act. And in fact, per the ISM on Friday, electrical gear in still in shortage).
So this is crowding out, but maybe it’s ok. A lot of people would say that reindustrialization and winning the AI race is more important than opening up a new Dutch Brothers location (sorry Chris). Others might say no, that the government (in subsidizing new industrialization) is distorting the market, and that market signals are demanding new Dutch Brothers. To each their own. But this is the real tension.
When it comes to all that hiring for health care and social assistance, people connect the dots to large government deficits, since much of this work is publicly financed in some way or another. And so they see crowding out. The government is plying the elderly directly with services or income support, and that’s constraining the availability of labor and resources for something else, whatever that is.
And I think that’s a real issue, and it’s at the heart of conversations about health care spending and Social Security. How can we provide seniors with some decent quality of life without putting undue burden on the more productive sectors of the economy? It’s a genuinely challenging question.
But to my mind, thecrowding out effect is an emergent phenomenon, regardless of how it’s financed. A society that gets older will, by physics, allocate more resources to eldercare. This is always the burden placed on the young, and the more inverted the demographic pyramid gets, the greater the burden.
And this is also true with AI, which by and large isn’t government funded. AI is driving scarcity of electrical goods. It’s putting upward pressure on the price of power itself. It seems plausible that given the sheer scale of AI investment right now, that it’s diminishing economy-wide productivity as resources get used, before the great efficiency payoff that everyone is hoping for.
Crowding out is a useful term. It’s just a shame that it’s almost exclusively used in conjunction with public sector deficits.
On the podcast
As mentioned, today we talked with TBPN co-hosts John Coogan and Jordi Hays. The two of them have a great livestreamed show that talks about the tech industry kind of like how ESPN covers sports, which is perfect for this moment of superstar AI salaries. We talk about the changing culture of Silicon Valley, and why it is that certain researchers are worth hundreds of millions of dollars.

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-08-04 23:22:38

Bị cấm nhưng vẫn tràn lan: Hàng chục ngàn chip AI lỗi của Nvidia được sửa lậu tại Trung Quốc

Reuters phát hiện khoảng 12 công ty tại Thâm Quyến (Trung Quốc) chuyên sửa chữa hàng trăm chip AI cao cấp của Nvidia như H100 và A100 mỗi tháng, dù các GPU này bị Mỹ cấm xuất khẩu sang Trung Quốc từ năm 2022.
Một công ty cho biết sửa tới 500 chip mỗi tháng, tương đương hàng chục ngàn đơn vị mỗi năm trên toàn thị trường sửa chữa ngầm.
Nhiều chip trong số này đã bị hao mòn nghiêm trọng do chạy liên tục suốt nhiều năm trong các tác vụ huấn luyện AI.
Các dịch vụ sửa chữa bao gồm thay quạt tản nhiệt, kiểm tra bo mạch, chẩn đoán bộ nhớ và kiểm tra phần mềm — với mức phí khoảng 10% giá trị mua ban đầu.
Một số cơ sở sửa chữa thậm chí có phòng máy mô phỏng điều kiện của trung tâm dữ liệu, với quy mô lên đến 256 máy chủ.
Nguồn cung chip chủ yếu đến từ việc buôn lậu, do Nvidia không được phép chính thức sửa chữa hay thay thế GPU bị hạn chế tại Trung Quốc.
Nvidia xác nhận rằng chỉ hãng và các đối tác ủy quyền mới có quyền cung cấp dịch vụ cho các dòng GPU hạn chế, đồng thời cảnh báo việc sử dụng chip không có hạ tầng đầy đủ là không bền vững.
Sự tồn tại của thị trường sửa chữa này phản ánh nhu cầu cực lớn tại Trung Quốc đối với các chip mạnh như H100 — vốn vẫn được ưa chuộng hơn so với phiên bản H20 mới mà Nvidia cung cấp theo quy định xuất khẩu.
Việc này đặt ra nghi vấn về rủi ro tiềm ẩn khi hàng chục ngàn chip AI cũ, lỗi có thể vẫn tiếp tục được sử dụng không kiểm soát trong các hệ thống nhạy cảm.
Ngoài yếu tố kinh tế, vấn đề còn liên quan đến an ninh công nghệ, lỗ hổng chuỗi cung ứng và khả năng kiểm soát phần cứng AI xuyên biên giới.

📌 Hàng chục ngàn chip AI Nvidia như H100 và A100 đang được sửa chữa không phép tại Trung Quốc thông qua thị trường ngầm, dù bị cấm xuất khẩu từ năm 2022. Nhu cầu lớn, kết hợp buôn lậu và thiếu hỗ trợ chính thức, đã tạo ra ngành công nghiệp sửa chữa GPU sôi động với quy mô hàng ngàn chip mỗi tháng. Điều này dấy lên cảnh báo về lỗ hổng công nghệ, an ninh và kiểm soát thiết bị AI toàn cầu.

https://www.techradar.com/pro/potentially-tens-of-thousands-of-faulty-nvidia-ai-chips-end-up-in-these-obscure-chinese-repair-shops-it-may-mask-something-even-more-vital

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-08-04 07:46:25

Ngành trung tâm dữ liệu 2025 lún sâu vào khủng hoảng chi phí, AI và nhân lực

Báo cáo khảo sát năm 2025 của Uptime Institute cho thấy chi phí vận hành tiếp tục là mối lo hàng đầu trong quản lý hạ tầng số, cùng với lo ngại ngày càng tăng về việc dự đoán nhu cầu công suất tương lai.
Hiệu suất sử dụng năng lượng (PUE) trung bình không thay đổi đáng kể trong 6 năm liên tiếp, dao động ở mức 1,54, do hạ tầng cũ và giới hạn khu vực trong làm mát hiệu quả.
Mật độ công suất giá đỡ máy chủ tiếp tục tăng nhẹ, với phần lớn trung tâm vận hành ở mức 10–30 kW; mức trên 30 kW vẫn hiếm.
Việc thu thập và báo cáo dữ liệu bền vững không cải thiện so với 2024. Chỉ 41% thu thập dữ liệu khí thải Scope 2; 26% ghi nhận lượng eWaste.
Niềm tin vào AI tùy thuộc mục đích: hầu hết đồng ý dùng cho phân tích cảm biến và bảo trì dự đoán, nhưng không chấp nhận cho điều khiển thiết bị hoặc thay đổi cấu hình.
50% trung tâm đã từng gặp sự cố ảnh hưởng trong 3 năm qua, giảm nhẹ so với 2024. Tuy nhiên, 10% sự cố vẫn gây gián đoạn nghiêm trọng.
Nguồn sự cố hàng đầu là mất điện (45%), chủ yếu do UPS, chuyển mạch và máy phát điện.
Chiến lược IT hybrid tiếp tục phổ biến: 45% khối lượng công việc vẫn lưu trữ tại trung tâm nội bộ, 55% ngoài cơ sở và dự kiến tăng lên 58% vào 2027.
Gần 2/3 trung tâm gặp khó khăn trong việc giữ chân hoặc tuyển dụng nhân sự; 46% khó tuyển ứng viên đủ năng lực, 37% khó giữ nhân viên.
Nhân viên thường chuyển sang đối thủ cạnh tranh chứ không rời ngành, cho thấy ngành vẫn hấp dẫn nhưng cần chế độ tốt hơn.

📌 Ngành trung tâm dữ liệu năm 2025 đối mặt chi phí cao, thiếu nhân lực (46% khó tuyển), và áp lực từ AI, với PUE giữ ở mức 1,54. 50% từng gặp sự cố ảnh hưởng; 45% do mất điện. Mặc dù AI được dùng tăng hiệu suất (58%), niềm tin vào điều khiển tự động vẫn thấp. IT hybrid là xu hướng chính, với 45% công việc vẫn trong trung tâm nội bộ.

https://uptimeinstitute.com/uptime_assets/cec7166957f7f529e48073bfcb5b0e99bf0dde906aa263aa7e834d33601db929-GA-2025-07-uptime-institute-global-data-center-survey-results-2025.pdf

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-08-03 08:45:23

Kỷ nguyên “Xây chậm, làm lớn”: Big Tech Mỹ chi 102,5 tỉ USD xây đế chế AI hạ tầng khổng lồ

Các công ty công nghệ lớn của Mỹ đang bước vào “kỷ nguyên hạ tầng”, nơi đầu tư khổng lồ vào trung tâm dữ liệu, nhà máy, bất động sản và năng lượng trở thành chiến lược cạnh tranh cốt lõi.
Trong quý gần nhất, 7 công ty công nghệ lớn (“The Magnificent 7”) đã chi kỷ lục 102,5 tỉ USD cho chi tiêu vốn (capex), với phần lớn đến từ Meta, Google, Microsoft và Amazon. Trong khi Apple, Nvidia và Tesla chỉ chi khoảng 6,7 tỉ USD.
Nhà phân tích Paul Kedrosky cho biết đầu tư AI hiện đã vượt qua đầu tư hạ tầng viễn thông thời kỳ dot-com, trở thành yếu tố tăng trưởng lớn nhất của kinh tế Mỹ trong hai quý gần nhất – thậm chí vượt cả chi tiêu tiêu dùng.
TSMC (Đài Loan) chi 10 tỉ USD mỗi quý; Foxconn đang xây dựng nhà máy tại Ấn Độ cho Apple, cho thấy đầu tư hạ tầng AI mang tính toàn cầu.
Các công ty không còn chỉ làm phần mềm, mà đang “vertical integration” – kiểm soát cả hạ tầng vật lý, giống như thời kỳ của Rockefeller hay Carnegie với đường sắt và thép.
Microsoft đang xây trung tâm dữ liệu trị giá 3,3 tỉ USD tại Wisconsin. Một số trung tâm dữ liệu còn được xây trên nền các nhà máy thép cũ, do gần nguồn năng lượng.
OpenAI gặp khó khăn trong việc cạnh tranh vì thiếu hạ tầng riêng và phải phụ thuộc vào vốn đầu tư liên tục. Meta đã “hút máu” kỹ sư từ OpenAI bằng mức lương khủng.
Trong khi đó, Apple và Nvidia ít chi capex hơn nhưng kiểm soát chuỗi cung ứng thông qua các hợp đồng sản xuất quy mô lớn.
Cạnh tranh nhân lực AI khốc liệt, với các thương vụ “acqui-hire” trị giá hàng trăm triệu USD và mức lương vượt chuẩn.
Giáo sư H.W. Brands cảnh báo các công ty này tuy giàu có nhưng sử dụng rất ít lao động, và việc chống độc quyền thường chỉ diễn ra sau khi họ đã thống trị thị trường.

📌 Các gã khổng lồ công nghệ Mỹ đang chi hơn 100 tỉ USD mỗi quý để xây dựng đế chế hạ tầng AI tương tự đường sắt và thép thế kỷ 19, tạo lợi thế áp đảo và khó bị cạnh tranh. Khi OpenAI gặp khó, Microsoft, Meta và Amazon dấn sâu vào cuộc chơi hạ tầng toàn cầu, biến trung tâm dữ liệu thành vũ khí chiến lược trong cuộc đua công nghệ với Trung Quốc.

https://www.wsj.com/tech/ai/silicon-valley-ai-infrastructure-capex-cffe0431

Silicon Valley’s New Strategy: Move Slow and Build Things

Big tech companies are becoming infrastructure companies—just like the steel and railroad giants of old

Christopher Mims

Aug. 1, 2025 5:30 am ET

James Steinberg

There’s a point in every technological cycle when engineers and inventors are rapidly innovating. The spoils go to those who “move fast and break things,” to quote 2010s-era Mark Zuckerberg.

We’re now entering a phase in which the giants win because they own, and continue to build out, the physical assets that make mature technologies accessible.

Call it an “age of infrastructure,” in which companies spend vast sums on actual stuff. Primarily that’s the gigantic data centers filled with tiny chips, and everything that connects and cools them, but it also includes factories, real estate and energy.

It’s reminiscent of the age of business titans and “robber barons” who dominated railroads, steel and other enterprises. And as happened then, today’s massive companies, with their ability to spend (and borrow), are making their moats even deeper and wider. Even formidable competitors, such as OpenAI, are hard-pressed to keep up.

A look at one key line item in company earnings reports—capital expenditures—shows that the most valuable tech companies are buying and building stuff at a record pace. The Magnificent 7 tech firms have collectively spent a record $102.5 billion on capex in their most recent quarters, nearly all from Meta, Alphabet (Google), Microsoft and Amazon. (Apple, Nvidia and Tesla together contributed a mere $6.7 billion.)

Investor and tech pundit Paul Kedrosky says that, as a percentage of gross domestic product, spending on AI infrastructure has already exceeded spending on telecom and internet infrastructure from the dot-com boom—and it’s still growing. He also argues that one explanation for the U.S. economy’s ongoing strength, despite tariffs, is that spending on IT infrastructure is so big that it’s acting as a sort of private-sector stimulus program.

Capex spending for AI contributed more to growth in the U.S. economy in the past two quarters than all of consumer spending, says Neil Dutta, head of economic research at Renaissance Macro Research, citing data from the Bureau of Economic Analysis.

A global accounting of this infrastructure spending would be even bigger, as it would include capex from these companies’ most important partners. Foxconn has recently spent big building out factories for Apple in India, which just supplanted China as the source of the majority of U.S.-destined iPhones, according to Canalys. And the world’s largest chip manufacturer, TSMC, spent about $10 billion on capex in its most recent quarter.

In the not-too-distant past, when Facebook, Microsoft and its competitors mostly produced code, salary and stock compensation was a much bigger proportion of their spending. For these companies to continue growing, they are now vertically integrating and owning more of what it takes to run their businesses.

Construction on the first phase of Microsoft’s $3.3 billion data center in Mount Pleasant, Wis., is expected to be completed in 2026.

This hasn’t exactly happened overnight, says Patrick Moorhead, an industry analyst, who calls what’s happening now “planet-scale infrastructure.”

Back in 2003, when Moorhead was an executive at AMD, his company sold Google some of its earliest systems for building out its data-center infrastructure as cheaply as possible. What had been expensive boxes—basically PCs on steroids—at the beginning of this century evolved in two decades into vast arrays of rack servers that facilitate today’s internet and the explosive growth of AI supercomputers. All of this IT infrastructure and its support systems are our generation’s railroads and steel mills, he adds.

OpenAI, arguably the most well funded startup, still has difficulty competing with the giants. It depends on continuous and gigantic infusions of investor cash, even as the fast-following big-tech companies peel off its customers and talent. OpenAI has struggled recently to realize its dream of a gigantic AI data center called Stargate, and Meta has lured away some of its engineers with eye-watering pay packages.

Meanwhile, Apple and Nvidia spend less on capex but direct huge contracts for chips and manufacturing to partners, so they’re able to monopolize the attention and output of those partners. And Tesla is historically no slouch, known for spending big on factories, a charging network, even mining operations.

In an almost too-perfect parallel to the bygone age of John D. Rockefeller, Andrew Carnegie and J.P. Morgan, some of today’s power-hungry data centers are actually being put on the sites of former steel mills, because of their proximity to energy sources.

It’s important not to take these comparisons too far, cautions H.W. Brands, a professor of history at the University of Texas at Austin and an authority on the late 19th century titans of industry. One difference: While they might spend big on infrastructure, today’s most valuable companies are lightly staffed. “The striking thing about these companies is compared with their wealth, how few people they employ,” he adds.

An area where we can draw a strong parallel, says Brands, is in antitrust enforcement: Now, as then, it only tends to happen long after companies reach their peak size and power. In terms of competition, there are hardly any signs these companies will be disrupted anytime soon, says Moorhead.

In addition to their record capex spending, many big tech companies are also engaged in an all-out war for certain kinds of talent, particularly in AI—railroads need engineers. Hundreds of millions of dollars are changing hands in “acqui-hires” and talent poaching. This war for talent is becoming yet another way that advantages accrue to the biggest tech companies with the deepest pockets.

The lesson in all this: When there isn’t much regulation, and competition is limited to a handful of coexisting hegemons, the biggest threats come from overseas. The U.S. and China are, of course, locked in a contest for global industrial dominance. America once had an easy lead—but its continuing success is no longer guaranteed.

Không có file đính kèm.

Nguồn tham khảo

Semi-Cloud-DC-Green AI chips-hardware-compute 2025-08-02 00:01:25

Malaysia bùng nổ trung tâm dữ liệu: tạo hơn 30.000 việc làm mỗi năm đến 2030

Malaysia đang chứng kiến sự bùng nổ ngành trung tâm dữ liệu, với dự báo tạo ra 30.900 việc làm mỗi năm vào năm 2030, theo báo cáo từ Hiệp hội Trung tâm Dữ liệu Châu Á - Thái Bình Dương (APDCA).
Trong số này, 4.300 việc làm sẽ thuộc lĩnh vực AI và điện toán đám mây, phản ánh sự chuyển dịch mạnh mẽ sang nền kinh tế số giá trị cao.
Đầu tư vào trung tâm dữ liệu tại Malaysia được dự báo tăng 185% từ 2023 đến 2025, đưa nước này trở thành thị trường hạ tầng số phát triển nhanh nhất Đông Nam Á.
Chỉ riêng năm 2024, Malaysia đã thu hút 34 tỷ USD đầu tư từ các nhà cung cấp đám mây toàn cầu và nhà phát triển trung tâm dữ liệu.
Trung tâm của sự phát triển là bang Johor, nơi đang chiếm 79% tổng công suất IT 505 megawatt của cả nước, nhờ vị trí gần Singapore, cơ sở hạ tầng điện ổn định và chính sách đầu tư ưu đãi.
Khoảng 40.000 việc làm đã được tạo ra tính đến nay trong các lĩnh vực như xây dựng, kỹ thuật cơ điện, vận hành hệ thống IT, triển khai cáp quang và an ninh cơ sở dữ liệu.
Tác động lan tỏa kinh tế rất lớn: mỗi việc làm trực tiếp tạo thêm 3,2 việc làm gián tiếp. Đến 2030, ngành sẽ đóng góp khoảng 1,3 tỷ USD thu nhập hằng năm, tăng gấp 7 lần so với năm 2024.
GVA (giá trị gia tăng gộp) từ xây dựng trung tâm dữ liệu ước đạt 7,6 tỷ USD mỗi năm, và thêm 4,2 tỷ USD mỗi năm khi các trung tâm đi vào hoạt động.
AI được kỳ vọng đóng góp thêm 115 tỷ USD vào GDP Malaysia giai đoạn 2025–2030 nếu được đầu tư đúng mức, thúc đẩy đổi mới trong giáo dục, y tế, sản xuất và tài chính.
Tuy nhiên, cảnh báo đã được đưa ra: nếu chi phí điện tăng do chính sách biểu giá mới, Malaysia có thể mất lợi thế cạnh tranh, ảnh hưởng đến tốc độ triển khai AI trong các lĩnh vực thiết yếu.

📌 Malaysia hướng đến nền kinh tế số trị giá hàng trăm tỷ USD, khi trung tâm dữ liệu trở thành động lực phát triển mới, tạo hơn 30.000 việc làm mỗi năm đến năm 2030, trong đó có 4.300 vị trí AI và đám mây. Johor chiếm 79% công suất IT quốc gia, nhưng chi phí điện có thể là rào cản tăng trưởng.

https://www.businesstimesintl.com/asean/malaysias-data-centre-boom-set-create-over-30000-jobs-2030

Không có file đính kèm.

Nguồn tham khảo

AI market AI chips-hardware-compute 2025-08-01 23:47:34

Trung Quốc sở hữu các mô hình AI hàng đầu thế giới nhưng lại gặp khó khăn trong khâu vận hành do thiếu chip

Trung Quốc đã cho ra đời những mô hình AI hàng đầu như DeepSeek v3 và Kimi K2, vượt trội về khả năng mã hóa và kiến thức khoa học, thậm chí vượt qua cả ChatGPT 4.1 và Claude 4 Opus.
Tuy nhiên, điểm nghẽn lớn nhất không phải ở đào tạo mà là ở khả năng suy luận (inference) do thiếu chip bán dẫn cao cấp như Nvidia H20, dẫn đến tình trạng chậm, giới hạn sử dụng và mất kết nối thường xuyên.
Moonshot AI thừa nhận trên X: “Kimi K2 đang RẤT RẤT CHẬM”. DeepSeek hoãn ra mắt mô hình tiếp theo để tránh lỗi tương tự.
Tin vui đến vào giữa tháng 7 khi chính quyền Trump bất ngờ dỡ bỏ lệnh cấm xuất khẩu chip H20 sang Trung Quốc, giúp tháo gỡ phần nào nút thắt về năng lực tính toán.
Trung Quốc có lợi thế về nhân lực khoa học kỹ thuật, nguồn dữ liệu khổng lồ, năng lượng sẵn có và ý chí chính trị, nhưng không có chuỗi cung ứng chip nội địa ổn định.
Trung Quốc đã lách luật bằng nhiều cách: nhập khẩu chip bị cấm trị giá 1 tỉ USD, phát triển chip nội địa như của Huawei, và tập trung phát hành mô hình nguồn mở qua nền tảng như Hugging Face để mở rộng ảnh hưởng dù thiếu hạ tầng.
Các mô hình như Qwen3 của Alibaba được tối ưu về hiệu suất, giúp chạy nhanh hơn và tiêu tốn ít tài nguyên hơn. Z.ai cũng ra mắt GLM-4.5 và 4.5 Air tập trung vào tốc độ và hiệu quả.
Trong khi đào tạo là chi phí một lần, thì inference là chi phí lặp lại – nếu thiếu chip inference, doanh nghiệp sẽ lỗ liên tục. Do đó, đây chính là nút thắt sống còn với AI Trung Quốc.
Mỹ đang có chiến lược hai mặt: vừa thắt chặt kiểm soát chip cao cấp, vừa mở lại xuất khẩu chip tầm trung như H20 để giữ Trung Quốc phụ thuộc vào công nghệ Mỹ thay vì phát triển nội lực.
Dù lệnh gỡ bỏ chip H20 có hiệu lực, Nvidia vẫn chưa đủ nguồn cung cho thị trường Trung Quốc cho đến cuối năm 2025. Do đó, ưu tiên hiện tại vẫn là mô hình nhẹ, chạy được trên máy tính cá nhân.
Nếu Mỹ duy trì xuất khẩu chip trong năm 2026, ngành AI Trung Quốc có thể bùng nổ trở lại, thoát khỏi nút thắt công suất hiện tại.

📌 Trung Quốc đang đứng đầu về mô hình AI nguồn mở nhưng bị kìm hãm bởi thiếu chip inference như H20. Quyết định bất ngờ từ Mỹ cho phép Nvidia xuất khẩu lại chip có thể tháo gỡ tạm thời, nhưng tương lai ngành AI Trung Quốc vẫn phụ thuộc vào nguồn cung chip và khả năng tự chủ công nghệ tính toán.

https://www.economist.com/science-and-technology/2025/07/30/china-has-top-flight-ai-models-but-it-is-struggling-to-run-them

China has top-flight AI models. But it is struggling to run them

Trump’s U-turn on chip-export controls could be a boon

Jul 30th 2025|5 min read

Six months ago DeepSeek, a Chinese artificial-intelligence (AI) firm, wowed the world with the v3 model and its successors. For the first time, a country other than America—and one that America had cut off from the supply of top-of-the-range semiconductor chips—was producing open-source models that rivalled those designed in Silicon Valley.

Despite the restrictions, Chinese firms kept training world-beating AI models—Kimi K2, unveiled in July by Moonshot AI, a Beijing-based lab founded by an alumnus of Google and Meta, rose straight to the top of the global leaderboards. With more parameters, as the connections between a model’s artificial neurons are called, than any open-source equivalent, Kimi K2 outperformed its Western rivals ChatGPT 4.1 on tests of coding ability and Claude 4 Opus on tests of science knowledge.

But for models to really impress, they need to be used. This is where chip restrictions have bitten the hardest. Shortages have affected the data centres AI labs need to run their systems once trained. Slowdowns, usage limits and dropped connections are becoming common. “We’ve heard your feedback—Kimi K2 is SLOOOOOOOOOOOOW,” Moonshot posted on X a few days after the launch. DeepSeek, meanwhile, has delayed the launch of its latest AI model to avoid similar performance issues, according to a report from the Information. And so both companies were given cause to celebrate two weeks ago, when the White House reversed its latest export controls, once again allowing Nvidia to sell its H20 chips in China. Making these available to tech companies there will remove the hurdles currently slowing their growth.

China is fertile ground for an AI boom: the country has millions of science and engineering graduates, spare grid capacity, the political will to build data centres as fast as concrete can be poured, and access to all the West’s public data sources and more of its own. It lacks a home-grown source of computing power, however, a fundamental constraint that has so far shaped the development of its industry.

In the past few months Chinese firms have found many ways to work around American restrictions. Banned chips worth $1bn have entered the country since April and domestic companies, such as Huawei, have developed chips to match Nvidia’s top-end offering in some respects (though at smaller volumes). A relentless focus on efficiency has also led to breakthroughs.

Limited access to chips also explains another feature of the Chinese AI sector that has baffled outsiders: the devotion to open-source releases. DeepSeek v3 and Kimi K2 are both available through third-party hosting services such as Hugging Face, based in New York, as well as to download and run on users’ own hardware. That helps ensure that, even if the company lacks the computing power to serve customers directly, support for its models is still available elsewhere. And the open-source releases serve as an end-run around hardware bans: if DeepSeek cannot easily acquire Nvidia chips, Hugging Face can.

Not all Chinese firms have been equally affected by the restrictions. On Friday Alibaba released the latest model in its Qwen 3 family, an open-source reasoning model called Qwen3-235B-A22B-Thinking-2507. The release brings Qwen, and Chinese AI in general, level with not just the best open-source AI models, but the best AI models full stop.

Alibaba’s system is around a quarter the size of K2, requiring commensurately less computing power to run, and, unlike DeepSeek and Moonshot, Alibaba has substantial cloud infrastructure behind it to keep the models working. Making models faster and more efficient to use is clearly the new game in the Chinese AI sector: on Monday another lab, Z.ai, released two models, called GLM-4.5 and 4.5 Air, explicitly touting their speed and efficiency.

But the canny workarounds and impressive models can stretch a resource constraint only so far. And since April, one limitation has bitten harder than any others: the loss of Nvidia’s H20 chips.

Successful AI companies must be able to do two things: train models and then run them, a process known as inference. The best-funded Chinese labs have continued to launch training runs of comparable scale to their Western peers. But inference has proved trickier. Whereas training data centres need monolithic clusters of top-end chips, inference is best performed by chips that balance power, energy efficiency and the ability to move data at speed. Until April, the H20 was the chip of choice.

Worse, while a training run is an upfront expense that can be recouped as revenue over the lifetime of the model, a company that loses money during inference has no opportunity to make it up. That means access to chips for inference, not training, is the bottleneck limiting the growth of China’s AI industry.

In response, the Trump administration has sent mixed signals. Its AI action plan, published in early July, doubled down on some chip controls, emphasising that denying adversaries access to “advanced AI compute” is a matter of both geostrategic competition and national security, and calling for novel approaches to enforcing export controls. At the same time, it has lifted the ban on H20 exports, arguing that it would be better for Chinese AI to rely on American companies for all their technology needs, including inference, than to develop an equivalent domestic capacity.

In the short term, such an easing will be cold comfort to China. Nvidia’s own supply constraints mean it will be unable to meet the country’s demand for chips until the last quarter of the year at the earliest. That means models which lean on efficient output and the ability to run on phones and laptops directly will continue to be prioritised for now. But if American exports pick up once more, then China’s AI sector could, at long last, start 2026 much less constrained. ■

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-07-31 06:12:56

Đông Nam Á đang chiếm quyền lực AI toàn cầu: GPU, dữ liệu và địa chính trị đổ về Singapore, Malaysia

Thủ tướng Singapore Lawrence Wong cảnh báo tại Bắc Kinh rằng các hạn chế kinh tế sẽ chỉ thúc đẩy các quốc gia tìm giải pháp thay thế – và Đông Nam Á đang trở thành mặt trận chính trong cuộc đua AI toàn cầu.
Khu vực này sở hữu hơn 700 triệu dân, phần lớn trẻ và am hiểu công nghệ, cùng với vị trí gần các nền kinh tế lớn như Trung Quốc, Ấn Độ, Nhật Bản và Úc.
Singapore, Malaysia, Thái Lan và Indonesia đang có tổng dung lượng trung tâm dữ liệu gần 2 GW, ngang với các trung tâm dữ liệu lớn nhất châu Âu (London và Frankfurt).
Singapore dẫn đầu với 60% năng lực trung tâm dữ liệu của khu vực, phân bổ đồng đều cho cả các công ty Mỹ (Equinix, Microsoft) lẫn Trung Quốc (GDS Holdings, ByteDance).
Các công ty Trung Quốc như Huawei, Alibaba, Tencent đang đầu tư mạnh vào AI tại Đông Nam Á. Tencent chi 500 triệu USD vào Indonesia, trong khi Huawei bán chip Ascend AI thay thế cho Nvidia ở khu vực.
Các công ty Mỹ cũng không đứng ngoài: Amazon đầu tư 9 tỷ USD ở Singapore, Microsoft chi 4 tỷ USD tại Malaysia và Indonesia, Alphabet đầu tư 2 tỷ USD vào Malaysia và 1 tỷ USD vào Thái Lan.
Quan hệ đối tác giữa Oracle (Mỹ) và ByteDance (Trung Quốc) đã biến Johor, Malaysia trở thành trung tâm AI lớn thứ hai thế giới, với đầu tư tổng cộng hơn 9 tỷ USD và phần lớn GPU Nvidia cung cấp cho ByteDance.
DayOne, công ty xây dựng trung tâm dữ liệu từng đặt tại Trung Quốc, đã chuyển trụ sở sang Singapore và trở thành nhà cung cấp chính cho ByteDance và Oracle.
Hàng loạt công ty khác cũng "di cư": Manus (startup AI Trung Quốc) và PC Partner Group (lắp ráp GPU Nvidia) đều đã chuyển trụ sở từ Trung Quốc hoặc Hồng Kông sang Singapore.
Tuy nhiên, dưới làn sóng đầu tư hợp pháp còn tồn tại mạng lưới buôn lậu chất bán dẫn và tài nguyên cấm, như vụ việc “Luxuriate Your Life” liên quan đến 390 triệu USD GPU bị cấm, được cho là đưa qua Singapore sang Malaysia.
Đáp lại áp lực từ Mỹ, Malaysia áp dụng kiểm soát xuất khẩu nghiêm ngặt đối với chip AI từ ngày 14/7/2025, yêu cầu khai báo 30 ngày trước khi vận chuyển.
Mạng lưới trung chuyển cũng xuất hiện ở mảng tài nguyên hiếm: sau lệnh cấm xuất khẩu antimon, gallium và germanium của Trung Quốc, các nguyên liệu này được gắn mác giả và vận chuyển qua Thái Lan, Mexico sang Mỹ.

📌 Đông Nam Á đang nổi lên là trung tâm quyền lực mới trong cuộc đua AI, nơi Mỹ và Trung Quốc đổ hàng chục tỷ USD vào dữ liệu, GPU và hạ tầng đám mây. Singapore và Malaysia dẫn đầu, vừa là đối tác công nghệ, vùng đệm địa chính trị, vừa là “cửa sau” trong các chuỗi cung ứng mờ ranh giới giữa hợp pháp và bất hợp pháp. Cuộc chiến AI đang xoay trục về phương Nam.

https://www.economist.com/asia/2025/07/29/south-east-asia-makes-an-ai-power-grab

South-East Asia makes an AI power grab

No other region is as appealing to both America and China

Jul 29th 2025|Singapore|5 min read

When Lawrence Wong visited China on his first trip as Singapore’s prime minister in June, he delivered a warning: economic restrictions are futile in an interconnected world. The more one country imposes restrictions on others, Mr Wong said in Beijing, “the more it incentivises others to find alternative solutions and sources”. Many of those alternative solutions are in South-East Asia, which is becoming a vital arena in the global tech competition between America and China.

Firms are motivated not just by the region’s 700m people, even though many of them are young and tech-savvy. South-East Asia’s proximity to China and other large economies (such as Australia, Japan and India) makes it an ideal base to serve global clients. Singapore, Malaysia, Thailand and Indonesia host nearly 2GW in data-centre capacity, equivalent to the combined infrastructure of Europe’s largest data-centre hubs, London and Frankfurt, according to Jones Lang LaSalle, a property-services firm.

Of all the countries in South-East Asia, Singapore and Malaysia benefit most from the AI race. Singapore, with its well-governed, stable economy, has deftly handled its relationships with America and China. In 2023 it awarded four new data-centre tenders: two to American firms (Equinix and Microsoft) and two to Chinese ones (GDS Holdings and a Bytedance-led group). It now hosts 60% of South-East Asia’s data-centre capacity.

Chinese firms have moved aggressively. Huawei and Alibaba, two of China’s internet giants, have built data centres across the region. Alibaba has partnered with Tencent, another Chinese tech titan, and GoTo, an Indonesian tech firm, to train Indonesians in cloud computing and AI. Tencent alone plans to invest $500m in Indonesia by 2030. Huawei has also begun selling its Ascend AI chips, an alternative to Nvidia’s high-end semiconductors that are banned for sale to Chinese firms, in the Middle East and South-East Asia. This is further evidence that China is building its own rival technological stack, rather than merely evading American export controls.

Meanwhile Alphabet, Amazon and Microsoft, America’s three big cloud-service providers, are also investing in South-East Asia. Amazon and Microsoft make up 60% of the cloud “infrastructure as a service” market in the region. Amazon plans to spend $9bn to expand in Singapore by 2028; Microsoft has pledged $4bn in Malaysia and Indonesia; Alphabet is building a $2bn data centre in Malaysia and investing $1bn in Thailand. Many American technology titans have their Asia headquarters in Singapore—including Alphabet, Apple, AWS, Meta and Microsoft—especially as the Chinese Communist Party has tightened its grip on Hong Kong, which was once the regional corporate hub for more traditional firms.

Perhaps the most telling example is the partnership between Oracle, the American cloud firm, and Bytedance, TikTok’s Chinese parent. Their partnership has helped turn Johor, the Malaysian state that neighbours Singapore, into the world’s second-largest AI hub, according to SemiAnalysis, a research firm. Bytedance will invest $2.7bn in Malaysia, while Oracle plans to invest over $6.5bn. Most of its graphics-processing-unit (GPU) capacity (the kind used to train AI models) in the region goes to Bytedance. The data centres are run by chips supplied by Nvidia, whose advanced semiconductors power generative AI.

Oracle’s data centres were built by DayOne, a data-centre developer that moved its headquarters from China to Singapore in 2025. Donald Trump’s AI Action Plan, which he unveiled on July 23rd, is “positive” news for data-centre projects across Asia, says Jamie Khoo, DayOne’s chief executive. Earlier in the year uncertainties about America’s policies on export controls created fear and discomfort in the industry, she adds. Mr Trump’s new policies create clearer rules for firms in Asia using high-end GPUs with American technology. According to SemiAnalysis, DayOne’s biggest customer is ByteDance; its second-biggest is Oracle. Together, Oracle and DayOne are also setting up a big cloud facility in Indonesia.

DayOne is far from the only firm to move its base to outside China. Manus, a Chinese AI startup, shifted its headquarters to Singapore in July. PC Partner Group, which assembles Nvidia GPUs for gaming, left Hong Kong for Singapore in 2024. Even Bytedance runs most of its international operations from Singapore—and repeatedly insists that it is not a Chinese firm. Other Chinese firms have also gained access to banned chips by renting servers in South-East Asian data centres. This remains legal, though controversial.

Beneath this flurry of legitimate activity is an underworld. In one attempt to circumvent semiconductor restrictions, a firm called “Luxuriate Your Life” bought servers from Dell and Supermicro, which may have contained banned Nvidia chips, in an alleged fraud worth $390m. The servers were thought to have been smuggled into Malaysia through Singapore. Singaporean authorities arrested three men suspected of shipping the chips to DeepSeek, a Chinese AI firm. If convicted, they face up to 20 years in prison.

More export controls are coming. Malaysia announced on July 14th that all exports, trans-shipments and transits of advanced AI chips would require a trade permit. Individuals and firms must notify Malaysian authorities at least 30 days before moving any items not explicitly covered by existing exemptions. This follows pressure from America to stop chips subject to export controls reaching China via Malaysia.

Of course, smuggling is not limited to semiconductors. When China banned exports of critical minerals such as antimony, gallium and germanium to America in 2024, a new trans-shipment network emerged. Between December 2024 and April 2025 America imported almost as much antinomy oxide from Thailand and Mexico as in the previous three years combined. Chinese firms shipped restricted materials through third countries, using false labels like “iron” or “art supplies”, reported Reuters. As boundaries between legal and illegal supply chains blur, South-East Asia’s role in the global tech economy—as a partner, a geopolitical buffer and a back door—will only grow. ■

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-07-29 10:25:01

Singapore sắp có trung tâm dữ liệu chạy bằng hydro đầu tiên: DayOne khởi công dự án 20MW

DayOne, công ty trung tâm dữ liệu khu vực châu Á – Thái Bình Dương, vừa khởi công trung tâm dữ liệu đầu tiên tại Singapore với công suất 20MW, diện tích sàn khoảng 40.000 m². Giai đoạn đầu dự kiến hoàn thành vào năm 2026.
Cơ sở này sẽ sử dụng công nghệ làm mát lai giữa khí và chất lỏng, đồng thời là trung tâm dữ liệu đầu tiên ở Singapore sử dụng pin nhiên liệu oxit rắn (SOFC) để tạo điện tại chỗ – thuộc thử nghiệm năng lượng hydro.
CEO Jamie Khoo khẳng định trung tâm này là dấu mốc chiến lược, nhằm xây dựng hạ tầng số xanh phục vụ AI và điện toán đám mây, góp phần vào mục tiêu trở thành nền kinh tế kỹ thuật số bền vững của Singapore.
DayOne nằm trong nhóm 4 công ty (gồm Equinix, Microsoft, AirTrunk) được phê duyệt 80MW công suất phát triển mới từ chương trình thí điểm của IMDA và Cơ quan Phát triển Kinh tế Singapore (EDB), đánh dấu kết thúc tạm thời lệnh cấm phát triển trung tâm dữ liệu mới kéo dài nhiều năm.
Công ty vừa ký hợp đồng mua điện (PPA) 10 năm với Sembcorp Power, cung cấp năng lượng có kèm theo chứng chỉ năng lượng tái tạo (REC) – được nhập khẩu hoặc sản xuất trong nước.
Song song, DayOne ký thỏa thuận nghiên cứu với Đại học Quốc gia Singapore (NUS) theo chương trình Sustainable Tropical Data Center Testbed 2.0 (STDCT 2.0) nhằm phát triển giải pháp làm mát tối ưu cho khí hậu nhiệt đới.
Nghiên cứu bao gồm thử nghiệm công nghệ như máy phát điện nhiên liệu linh hoạt, pin nhiên liệu, làm mát bằng chất lỏng thế hệ mới.
DayOne hiện sở hữu 500MW trung tâm dữ liệu đang hoạt động hoặc xây dựng và hơn 500MW đã có quỹ đất sẵn tại Hồng Kông, Singapore, Malaysia, Indonesia, Nhật Bản và gần đây là Thái Lan.
DayOne từng thuộc sở hữu của GDS International (Trung Quốc) và đã được tách riêng đầu năm nay với sự tham gia của các nhà đầu tư bên ngoài.

📌 DayOne đang mở rộng hạ tầng kỹ thuật số xanh với trung tâm dữ liệu 20MW tại Singapore – cơ sở đầu tiên sử dụng pin nhiên liệu hydro tại chỗ. Dự kiến hoạt động vào năm 2026, dự án kết hợp PPA năng lượng tái tạo và nghiên cứu với NUS để tối ưu hóa làm mát trong môi trường nhiệt đới. Với hơn 1.000MW năng lực đang và sẽ triển khai, DayOne khẳng định vị thế khu vực về trung tâm dữ liệu bền vững.

https://www.datacenterdynamics.com/en/news/dayone-breaks-ground-on-20mw-data-center-in-singapore/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-07-27 08:07:21

AI và trung tâm dữ liệu trở thành mặt trận nóng trong cuộc chiến công nghệ toàn cầu

AI và dữ liệu đã chuyển từ hạ tầng hỗ trợ sang tài sản chiến lược, trở thành tâm điểm của cạnh tranh địa chính trị giữa các cường quốc, đặc biệt là Mỹ và Trung Quốc.
Sự cạnh tranh về AI được đánh dấu bằng rào cản thương mại, tham vọng phát triển AI riêng biệt và nỗ lực kiểm soát dữ liệu cùng cơ sở hạ tầng xử lý.
Dữ liệu không còn là dòng chảy tự do; thay vào đó, các quốc gia như EU và Trung Quốc đang đặt ra luật giữ dữ liệu nhạy cảm trong biên giới để tránh rủi ro giám sát và mất kiểm soát chủ quyền số.
Trung tâm dữ liệu hiện được xem là hạ tầng quan trọng giống như nhà máy điện – chiếm 95% lưu lượng internet toàn cầu. Mỹ hiện nắm giữ khoảng 51% số trung tâm dữ liệu toàn cầu.
Cuộc đua xây dựng trung tâm dữ liệu tăng mạnh, đặc biệt tại châu Á, nơi nhiều quốc gia cung cấp ưu đãi thuế và giấy phép nhanh để thu hút đầu tư hạ tầng số.
Sở hữu trung tâm dữ liệu không chỉ mang lại tăng trưởng kinh tế mà còn đảm bảo "kháng số" – giảm lệ thuộc kết nối và tăng cường tự chủ trong khủng hoảng.
Tuy nhiên, ngành công nghiệp trung tâm dữ liệu cũng đang chịu tác động từ căng thẳng địa chính trị: chuỗi cung ứng chip tiên tiến, cáp quang, linh kiện đều có thể bị cắt bởi các lệnh cấm xuất khẩu và trừng phạt.
Từ năm 2022, Mỹ triển khai chính sách “tách rời công nghệ” (tech decoupling) nhằm kiềm chế đà phát triển công nghệ của Trung Quốc, đỉnh điểm là lệnh cấm toàn diện chip AI vào giữa năm 2025.
Điều này khiến Trung Quốc thiếu linh kiện AI tiên tiến, đồng thời khiến các đồng minh của Mỹ phải cân nhắc chọn phe hoặc tách riêng chuỗi cung ứng.
Liên minh mới như “Chip 4” (Mỹ, Nhật, Đài Loan, Hàn Quốc) hình thành để thống nhất chiến lược bán dẫn, trong khi Trung Quốc phát triển “Con đường tơ lụa số” để duy trì ảnh hưởng công nghệ.
Thế giới đang đứng trước ngã ba đường: hoặc rơi vào phân mảnh công nghệ với “bức màn sắt số” chia cắt AI, tiêu chuẩn và dữ liệu, hoặc đối thoại để thiết lập tiêu chuẩn chung về an toàn và thương mại số.

📌 Trung tâm dữ liệu và AI đang trở thành mặt trận chiến lược trong cạnh tranh công nghệ toàn cầu, khi Mỹ nắm 51% hạ tầng toàn cầu và áp dụng lệnh cấm chip với Trung Quốc. Chính sách “tách rời công nghệ” đang chia tách thế giới thành hai hệ sinh thái công nghệ, buộc các nước khác phải cân bằng giữa hợp tác và đối đầu. Tương lai AI toàn cầu sẽ phụ thuộc vào lựa chọn hiện tại của các nhà hoạch định chính sách.

https://www.weforum.org/stories/2025/07/ai-geopolitics-data-centres-technological-rivalry/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-07-27 07:31:50

Trung Quốc: GPU nội địa 6nm Lisuan 7G106 và 7G105, hiệu năng tương đương RTX 4060

Trung Quốc đạt bước tiến lớn với GPU nội địa Lisuan 7G106 và 7G105, được thiết kế trên tiến trình 6nm của TSMC và sử dụng kiến trúc TrueGPU do Lisuan tự phát triển hoàn toàn, bao gồm cả tập lệnh và lõi tính toán.
Lisuan 7G106 (dành cho người dùng cá nhân) có 12 GB GDDR6, bus 192-bit, hiệu năng FP32 đạt 24 TFLOP/s, hỗ trợ DirectX 12, Vulkan 1.3, OpenGL 4.6 và OpenCL 3.0. Công suất tiêu thụ khoảng 225W qua 1 đầu nối PCIe 8-pin.
Phiên bản chuyên nghiệp 7G105 dùng cho AI và dữ liệu lớn, gấp đôi bộ nhớ lên 24 GB có ECC, hỗ trợ ảo hóa lên đến 16 GPU ảo (vGPU), và có thể xử lý AI mô hình lớn như DeepSeek và Wenshengtu.
GPU này hỗ trợ giải mã video AV1 và HEVC lên đến 8K60, mã hóa video AV1 4K30 và HEVC 8K30, tương thích 4 cổng DisplayPort 1.4 hỗ trợ độ phân giải đến 8K60.
Kiến trúc TrueGPU tích hợp các tính năng độc đáo như: xử lý tam giác không tuần tự (giúp tăng hiệu suất 50%), bố cục bộ nhớ dạng ma trận tăng 40% hiệu suất, phát lệnh kép FP32/INT32, cân bằng tải động và khả năng đa nhiệm tới 48 tác vụ.
Trong các bài test tổng hợp, Lisuan 7G106 đạt 26.800 điểm Fire Strike, 111.290 điểm Geekbench 6 OpenCL – vượt nhẹ RTX 4060 (~10%). Game AAA như Black Myth: Wukong hay Shadow of the Tomb Raider chạy mượt 4K >70 FPS.
GPU này có tiềm năng phá vỡ thế độc quyền của AMD và Nvidia ở phân khúc trung cấp, với hướng tiếp cận “ưu tiên nội địa” trong bối cảnh giá linh kiện tăng và hạn chế xuất khẩu từ phương Tây.
Dự kiến bắt đầu sản xuất hàng loạt vào tháng 9/2025 sau khi mẫu thử hoàn tất trong tháng 8. Giá bán và xung nhịp cuối cùng chưa được công bố.

📌 Lisuan 7G106 và 7G105 đánh dấu bước tiến vượt bậc của Trung Quốc trong lĩnh vực GPU, với thiết kế nội địa hoàn toàn trên tiến trình 6nm, hiệu năng tương đương RTX 4060, chạy game 4K trên 70 FPS và hỗ trợ AI quy mô lớn. Sản xuất hàng loạt dự kiến bắt đầu từ tháng 9/2025, mở ra khả năng cạnh tranh thực sự với AMD và Nvidia.

https://www.tomshardware.com/pc-components/gpus/china-advances-toward-tech-independence-with-new-homegrown-6nm-gaming-and-ai-gpus-lisuan-7g106-runs-chinese-aaa-titles-at-4k-over-70-fps-and-matches-rtx-4060-in-synthetic-benchmarks

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-07-26 08:25:40

Trung Quốc dồn lực bán công suất AI thừa toàn quốc nhưng kẹt giữa Nvidia và Huawei

Trung Quốc đang triển khai kế hoạch xây dựng mạng lưới điện toán quốc gia để phân phối công suất thừa từ các trung tâm dữ liệu (DC) trên khắp nước nhằm tối ưu hóa đầu tư và đáp ứng nhu cầu AI đang tăng.
Chương trình "Eastern Data, Western Computing" đã dẫn đến hàng trăm trung tâm dữ liệu được xây dựng tại các vùng phía tây có chi phí điện thấp nhưng không đáp ứng được yêu cầu độ trễ dưới 20 mili giây cho các ứng dụng thời gian thực.
Kết quả là nhiều trung tâm dữ liệu chỉ hoạt động ở mức 20–30% công suất, trong khi đầu tư vẫn tăng – năm 2024 chi tiêu đạt 3,4 tỷ USD, vượt cả năm trước.
Trong 18 tháng qua, hơn 100 dự án trung tâm dữ liệu bị hủy bỏ, so với chỉ 11 dự án năm 2023, khiến chính quyền địa phương lo ngại về hiệu quả đầu tư dài hạn.
Ủy ban Cải cách và Phát triển Quốc gia (NDRC) đang tăng cường rà soát và hạn chế xây dựng cơ sở hạ tầng điện toán nhỏ, buộc các dự án mới phải đáp ứng ngưỡng hiệu suất tối thiểu và có hợp đồng mua bán rõ ràng.
Bộ Công nghiệp và Công nghệ Thông tin (MIIT) đang hợp tác với China Mobile, China Telecom và China Unicom để xây dựng nền tảng điện toán đám mây tập trung, giúp bán công suất còn dư dưới dạng dịch vụ.
Tuy nhiên, kế hoạch này vấp phải hai thách thức lớn:
- Độ trễ mạng cao do hạ tầng phía tây yếu, không đạt tiêu chuẩn 20ms.
- Không tương thích phần cứng: một số DC dùng Nvidia (CUDA), số khác dùng Huawei Ascend (CANN), gây khó khăn khi tích hợp thành nền tảng điện toán hợp nhất.
MIIT có thể phải chấp nhận cung cấp dịch vụ theo loại phần cứng, tức là khách hàng sẽ chọn giữa cụm máy Nvidia hoặc Huawei, điều này có thể giảm hiệu quả khai thác các hệ thống Huawei.
Bất chấp trở ngại, Bắc Kinh tin rằng điều phối công suất tập trung sẽ nâng cao hiệu quả AI quốc gia, tối ưu hóa chi phí đầu tư và hỗ trợ tham vọng dẫn đầu về AI và dịch vụ đám mây.
Các nhà phân tích cảnh báo rằng việc tích hợp phần cứng dị biệt là nhiệm vụ cực kỳ phức tạp và cần nhiều thời gian, với rủi ro không đạt được kỳ vọng ban đầu.

📌 Trung Quốc đang cố gắng tái cấu trúc hạ tầng trung tâm dữ liệu qua mạng lưới điện toán quốc gia để bán công suất AI dư thừa. Tuy nhiên, thách thức lớn về độ trễ và không đồng bộ phần cứng Nvidia-Huawei có thể làm chậm tiến độ. Trong khi chính phủ tiếp tục đầu tư mạnh, hơn 100 dự án đã bị hủy, cho thấy nhu cầu thực tế chưa tương xứng với kỳ vọng phát triển ban đầu.

https://www.tomshardware.com/desktops/servers/china-is-developing-nation-spanning-network-to-sell-surplus-data-center-compute-power-latency-disparate-hardware-are-key-hurdles

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-07-25 06:39:44

SK Hynix thu lợi nhuận kỷ lục, chuẩn bị "rót tiền khủng" vì cơn sốt chip AI

SK Hynix ghi nhận lợi nhuận ròng quý II/2025 đạt 6.996 nghìn tỷ won (5,09 tỉ USD), tăng 70% so với cùng kỳ năm trước; doanh thu đạt kỷ lục 22.232 nghìn tỷ won, tăng 35%.
Lợi nhuận hoạt động tăng vọt 67%, đạt 9.213 nghìn tỷ won, vượt xa Samsung Electronics (ước tính 4.6 nghìn tỷ won).
Nhu cầu mạnh từ các công ty công nghệ lớn trên toàn cầu đã thúc đẩy tiêu thụ chip nhớ phục vụ AI, đặc biệt là sản phẩm HBM3E 12 lớp dành cho Nvidia.
SK Hynix xác nhận kế hoạch tăng gấp đôi doanh số HBM trong năm và sẽ đầu tư chủ động để đáp ứng kịp thời sản xuất.
Công ty sẽ mở nhà máy mới tại Hàn Quốc vào quý IV/2025 để sản xuất DRAM và HBM từ năm 2026. Một nhà máy khác sẽ hoàn tất xây dựng vào quý II/2027.
SK Hynix có kế hoạch sản xuất hàng loạt chip HBM4 trong nửa cuối năm 2025, có thể nới rộng khoảng cách với Samsung và Micron.
Cổ phiếu SK Hynix đã tăng 55% từ đầu năm đến nay, vượt xa mức tăng 33% của chỉ số Kospi.
Tuy nhiên, Goldman Sachs đã hạ xếp hạng cổ phiếu từ "mua" xuống "trung lập", dự báo mức tăng trưởng lợi nhuận sẽ chậm lại trong năm 2026 do giá HBM giảm và cạnh tranh gay gắt hơn.
Căng thẳng thương mại Mỹ - Hàn có thể đe dọa triển vọng SK Hynix. Hàn Quốc đối mặt với thuế quan 25% từ Mỹ nếu không đạt thỏa thuận trước ngày 1/8.
Ngoài ra, Tổng thống Trump còn đe dọa áp thuế bổ sung với ngành bán dẫn, xe hơi, thép và nhôm từ Hàn Quốc.
Trong diễn biến tích cực, Mỹ đã cho phép Nvidia xuất khẩu chip AI H20 (dùng HBM kém tiên tiến hơn) sang Trung Quốc, đảo ngược chính sách cấm hồi tháng 4.

📌 Với doanh thu và lợi nhuận kỷ lục trong quý II/2025, SK Hynix hưởng lợi mạnh từ nhu cầu chip AI toàn cầu, đặc biệt là HBM3E cho Nvidia. Công ty chuẩn bị đầu tư thêm, sản xuất HBM4 và mở rộng nhà máy để giữ vị thế dẫn đầu. Tuy nhiên, rủi ro cạnh tranh, giá chip giảm và căng thẳng thương mại Mỹ - Hàn có thể ảnh hưởng đến tăng trưởng trong 2026.

https://www.wsj.com/business/earnings/sk-hynix-earnings-streak-continues-on-ai-chip-demand-8afd94d6

SK Hynix to Boost Investment After Record Results on Strong AI Chip Demand

The company expects brisk HBM demand to continue through 2025

Kwanwoo Jun

Updated July 24, 2025 2:15 am ET

SK Hynix said aggressive AI investments by global big technology companies led to a steady increase in demand for AI memory chips, including 12-layer HBM3E products.

SK Hynix, the main supplier of high-bandwidth-memory products for Nvidia, plans to increase spending this year to meet strong demand for artificial-intelligence chips that helped it achieve a record second quarter.

The South Korean memory-chip maker said Thursday that aggressive AI investments by global big technology companies led to a steady increase in demand for AI memory chips, including 12-layer HBM3E products. Shipments of both DRAM and NAND flash memory products were higher than expected, it said.

“Our total investment for this year is expected to increase compared to the previous plans,” an SK Hynix executive said in an earnings call. “Some proactive investment this year is necessary to ensure timely support of our HBM products.”

Seeking to ease market concerns about a possible slowdown in AI chip demand, he assured investors of the “low likelihood” of any sharp correction, citing new product launches by clients scheduled for the second half of this year.

“Our plan to double HBM sales year-over-year remains unchanged,” he said, reaffirming SK Hynix’s plan to open a new South Korea plant in the final quarter of 2025 to produce DRAM and HBM products from next year. Construction of another South Korea plant is on track for completion in the second quarter of 2027, he said.

SK Hynix has said it expects brisk HBM demand to continue through 2025, given the current AI boom, which requires high-performance chips.

On Thursday, it posted net profit of 6.996 trillion won, equivalent to $5.09 billion, for the three months ended June, up 70% from a year earlier. That missed the 7.087 trillion won consensus estimate of analysts in a FactSet poll.

Revenue rose 35% to a quarterly record of 22.232 trillion won. Operating profit jumped 67% to 9.213 trillion won, also a record and beating bigger rival Samsung Electronics’ estimated 4.6 trillion won for the quarter.

SK Hynix has had an edge over its rival HBM manufacturers, benefiting from the boom in the premium chip segment. The stock has climbed 55% so far this year, outperforming the local benchmark Kospi’s year-to-date gain of 33%.

The company plans to mass produce new, cutting-edge HBM4 products in the second half of 2025, potentially widening its lead over Samsung and Micron Technology. SK Hynix pulled ahead of its competitors after it began mass production of 12-layer HBM3E products for Nvidia last year.

Some analysts, however, have turned cautious on the South Korean chip maker following its blistering share-price rally. Goldman Sachs last week warned that SK Hynix’s earnings growth could lose steam in 2026 on a possible decline in HBM product prices.

Goldman downgraded the stock to neutral from buy, citing the likelihood of fiercer competition in the HBM market and less favorable supply-demand conditions from next year.

President Trump’s erratic trade policies also pose a threat to SK Hynix’s outlook. South Korea faces a so-called reciprocal tariff of 25% if the country fails to reach a trade deal with the Trump administration by Aug. 1.

Trade officials from both sides are set to resume negotiations in Washington later this week as Seoul seeks to avoid or lower the blanket U.S. tariffs.

The U.S. leader has also threatened to impose a separate duty on semiconductors, in addition to levies on autos, steel and aluminum imports.

Meanwhile, Trump has decided to allow Nvidia to export its H20 AI chips, which use less advanced HBM products, to China. The move marked a reversal in policy from the Commerce Department, which in April restricted sales of the chip to Chinese customers.

Không có file đính kèm.

Nguồn tham khảo

Semi-Cloud-DC-Green AI chips-hardware-compute 2025-07-25 06:20:44

Lệnh hành pháp mới của Tổng thống Mỹ tăng tốc quy trình cấp phép liên bang cho hạ tầng DC AI

Tổng thống Mỹ ký lệnh hành pháp nhằm đẩy nhanh quy trình cấp phép liên bang cho các dự án trung tâm dữ liệu AI và hạ tầng liên quan.
Dự án đủ điều kiện phải đáp ứng một trong các tiêu chí: chi tiêu trên 500 triệu USD, tăng phụ tải điện trên 100 MW, liên quan đến an ninh quốc gia hoặc được các Bộ trưởng liên quan chỉ định.
Hạ tầng được hỗ trợ bao gồm: đường truyền tải điện, nhà máy điện khí, than, hạt nhân, địa nhiệt, thiết bị bán dẫn, mạng, lưu trữ dữ liệu và phần mềm đám mây.
Chính phủ sẽ sử dụng đất liên bang (gồm cả căn cứ quân sự) để bố trí các dự án đủ điều kiện, ưu tiên các khu đất ô nhiễm (Brownfield, Superfund) để tái sử dụng hiệu quả.
Hỗ trợ tài chính được triển khai dưới dạng: vay ưu đãi, bảo lãnh vay, trợ cấp, ưu đãi thuế, và hợp đồng thu mua sản phẩm đầu ra.
Bãi bỏ Lệnh hành pháp 14141 trước đó, để ưu tiên chính sách mới toàn diện hơn về AI và trung tâm dữ liệu.
Giảm quy trình đánh giá môi trường (NEPA) cho các dự án không gây ảnh hưởng nghiêm trọng đến môi trường; miễn trừ NEPA cho dự án sử dụng dưới 50% vốn liên bang.
Thiết lập hệ thống theo dõi dự án minh bạch thông qua bảng điều khiển Permitting Dashboard thuộc chương trình FAST-41.
Cơ quan EPA được yêu cầu điều chỉnh luật liên quan đến không khí, nước, chất độc hại để đẩy nhanh cấp phép môi trường.
Sử dụng tham vấn chương trình (programmatic consultation) để đơn giản hóa đánh giá sinh học và nguồn nước trong 10 năm tới.
Bộ Quốc phòng có quyền cho thuê đất căn cứ quân sự phục vụ dự án hạ tầng trung tâm dữ liệu AI, tùy theo nhu cầu an ninh và lực lượng.

📌 Lệnh hành pháp mới của Tổng thống Mỹ khởi động kỷ nguyên “siêu tốc” cho trung tâm dữ liệu AI với đầu tư tối thiểu 500 triệu USD/dự án, ưu tiên cấp phép nhanh, sử dụng đất liên bang và miễn trừ môi trường. Lệnh này thay thế EO 14141, thúc đẩy AI, bán dẫn, năng lượng và lưu trữ dữ liệu, nhằm đảm bảo vị thế công nghệ và an ninh quốc gia Mỹ.

https://www.whitehouse.gov/presidential-actions/2025/07/accelerating-federal-permitting-of-data-center-infrastructure/

Không có file đính kèm.

Nguồn tham khảo

STI AI chips-hardware-compute 2025-07-22 08:54:08

Anh công bố lộ trình tính toán trị giá 2 tỷ bảng để thúc đẩy hạ tầng điện toán quốc gia

Vương quốc Anh công bố “Compute Roadmap 2025” trị giá 2 tỷ bảng nhằm xây dựng hạ tầng tính toán bền vững, độc lập và sẵn sàng cho tương lai, với trọng tâm dài hạn là tích hợp máy tính lượng tử.
Máy tính lượng tử được xác định là công nghệ đầy tiềm năng và sẽ được ưu tiên đầu tư qua các testbed, trung tâm siêu máy tính quốc gia và các vùng tăng trưởng AI (AI Growth Zones).
Bộ trưởng Khoa học, Đổi mới và Công nghệ Peter Kyle nhấn mạnh điện toán đang trở thành yếu tố chiến lược toàn cầu, với các quốc gia như Mỹ, Canada và UAE đầu tư hàng tỷ USD cho hạ tầng công cộng.
Trong năm 2025, các công ty hyperscaler trên thế giới cam kết chi hơn 300 tỷ USD cho hạ tầng tính toán, định hình lại chuỗi cung ứng toàn cầu và hình thành liên minh AI – chip – năng lượng.
Lộ trình Anh cho thấy ý định đưa lượng tử thoát khỏi nghiên cứu thử nghiệm, tích hợp vào hệ thống tính toán thực tiễn như siêu máy tính quốc gia Edinburgh trị giá 750 triệu bảng.
Đề xuất “Compute Bridge” giúp các công nghệ phát triển trong nước (như lượng tử) được kiểm thử, sau đó thương mại hóa nếu đạt hiệu quả.
Chính phủ dành phần dung lượng AIRR cho công nghệ mới như chip, kiến trúc và phần mềm lượng tử, mở cơ hội cho startup và nhà nghiên cứu trong nước.
Hệ sinh thái tính toán của Anh hướng tới 6 GW AI-capable compute vào năm 2030, trong đó lượng tử là một phần của hệ thống lai giữa AI và điện toán cổ điển.
Lộ trình cũng nhấn mạnh chủ quyền số qua kiểm soát dữ liệu nhạy cảm, hạn chế phụ thuộc vào hạ tầng nước ngoài và tận dụng thế mạnh lượng tử trong photonics, tối ưu hóa phần mềm và thiết kế chip.
Đơn vị AI chủ quyền (Sovereign AI Unit) được rót 500 triệu bảng, tập trung phát triển lượng tử, cấp dung lượng tính toán và tài trợ dự án có lợi thế chiến lược.
Thư viện benchmark nguồn mở sẽ được tạo lập nhằm đánh giá lượng tử qua bài toán thực tế thay vì chỉ số trừu tượng.

📌 Vương quốc Anh đang đầu tư 2 tỷ bảng để phát triển hệ sinh thái tính toán tích hợp lượng tử, nhắm đến mục tiêu sẵn sàng vào năm 2030. Máy tính lượng tử sẽ không còn là lĩnh vực nghiên cứu biệt lập mà trở thành phần lõi trong trung tâm siêu máy tính, AI Growth Zones và chính sách chủ quyền AI. Dù còn rủi ro và thách thức về nhân lực và thương mại hóa, chiến lược này cho thấy Anh quyết tâm định vị mình là quốc gia dẫn đầu toàn cầu về tính toán lượng tử.

https://thequantuminsider.com/2025/07/21/uks-2-billion-compute-roadmap-signals-countrys-ambition-for-quantum-leadership/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-07-18 07:37:49

Meta dựng lều chống bão để xây trung tâm dữ liệu AI tiêu thụ 5 GW

Meta đang triển khai xây dựng trung tâm dữ liệu AI quy mô lớn bằng cách sử dụng các lều chống bão, nhằm rút ngắn thời gian xây dựng so với các tòa nhà bê tông truyền thống.
Mark Zuckerberg công bố các trung tâm dữ liệu mới có thể tiêu thụ hơn 5 gigawatt điện, kèm hình ảnh minh họa kích thước "nuốt trọn" một phần Manhattan.
Các lều được gọi là "rapid deployment structures" – cấu trúc triển khai nhanh – làm từ vải chống đâm thủng và chống nước, có mái vòm hình nấm, được đỡ bằng khung nhôm.
Trung tâm dữ liệu đầu tiên sử dụng mô hình này đặt tại New Albany, Ohio, có tên là Prometheus. Đây là một cơ sở hiện có đang được mở rộng thêm bằng các lều chứa server và GPU.
Prometheus dự kiến đạt công suất hơn 1 gigawatt vào năm 2026, trở thành một trong những cụm huấn luyện AI lớn nhất thế giới, theo công ty SemiAnalysis.
Trung tâm dữ liệu thứ hai, có tên Hyperion, đang được xây dựng tại Richland Parish, Louisiana, dự kiến đạt công suất 2 gigawatt vào năm 2030 và có thể mở rộng lên 5 gigawatt.
Khu vực Hyperion rộng khoảng 3 dặm vuông, chứa 11 tòa nhà với tổng diện tích hơn 4 triệu foot vuông (~371.600 mét vuông), vẫn nhỏ hơn so với Manhattan rộng 22 dặm vuông.
Việc sử dụng lều là giải pháp giúp Meta cạnh tranh trong cuộc đua AI với các đối thủ như OpenAI, Microsoft, và Alphabet, tập trung vào tốc độ triển khai hạ tầng hơn là hình thức kiến trúc.
Zuckerberg cho biết ông hào hứng với phương pháp xây dựng sáng tạo này, vì nó rút ngắn đáng kể thời gian xây trung tâm dữ liệu truyền thống vốn kéo dài 4 năm.

📌 Meta đang cách mạng hóa cách xây dựng trung tâm dữ liệu AI bằng lều chống bão, cho phép rút ngắn thời gian xây dựng và triển khai GPU nhanh chóng. Trung tâm Prometheus tại Ohio sẽ vượt 1 gigawatt vào năm 2026, còn Hyperion tại Louisiana có thể đạt 5 gigawatt vào năm 2030. Đây là chiến lược giúp Meta tăng tốc vượt trội trong cuộc đua AI toàn cầu.

https://www.fastcompany.com/91369896/meta-is-using-tents-to-build-its-giant-ai-data-centers

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-07-18 00:25:35

Trung Quốc dùng đất hiếm làm đòn bẩy khiến Mỹ nới chip AI

Mỹ vừa nới lỏng hạn chế xuất khẩu chip AI Nvidia H20 và AMD MI308 cho Trung Quốc như một phần trong gói thỏa thuận thương mại đang được đàm phán song phương.
Quyết định được đưa ra ngay trước vòng đàm phán cấp cao sắp tới, cho thấy hai bên đang "chuyển hướng" về phía đàm phán G2, theo chuyên gia Zhuang Bo (Loomis Sayles).
Nvidia xác nhận chính phủ Mỹ đảm bảo sẽ cấp giấy phép, trong khi AMD cho biết Bộ Thương mại đang xem xét lại đơn xuất khẩu.
Bộ trưởng Tài chính Mỹ Scott Bessent cho rằng quyết định này là một phần trong “bức tranh ghép” đàm phán Geneva và London, nhấn mạnh Mỹ đang ở “vị trí tốt” và trấn an thị trường trước hạn áp thuế 12/8.
Trung Quốc siết xuất khẩu đất hiếm từ tháng 4/2025 như đòn đáp trả các hạn chế chip và thuế từ Mỹ. Dù đã nối lại xuất khẩu sang Mỹ, sản lượng chưa phục hồi như trước.
Theo Bộ trưởng Thương mại Mỹ Howard Lutnick, Nvidia H20 chỉ là “đồ cấp 4”, đủ để làm Trung Quốc phụ thuộc vào công nghệ Mỹ mà không ảnh hưởng an ninh quốc gia.
Giáo sư Cui Fan cho rằng Mỹ duy trì chiến lược kiểm soát biên: khi Trung Quốc phát triển tương đương, Mỹ sẽ nới để cạnh tranh thị phần, tạo áp lực lên các nhà sản xuất nội địa Trung Quốc.
Tuy nhiên, sản xuất chip AI nội địa Trung Quốc vẫn chưa đáp ứng đủ nhu cầu, đặc biệt về hiệu năng đa dụng. Việc nới lỏng sẽ giúp nước này phối hợp nguồn lực quốc tế và chuỗi cung ứng tốt hơn.
Morgan Stanley nhận định đây là tín hiệu tích cực ban đầu trong tiến trình khôi phục quan hệ, nhất là khi có tin Tổng thống Trump cân nhắc thăm Trung Quốc.
Tuy nhiên, nguy cơ suy thoái kinh tế, giảm phát và khủng hoảng bất động sản tại Trung Quốc vẫn là những yếu tố gây cản trở tiến trình này.

📌 Việc Mỹ bật đèn xanh cho xuất khẩu chip AI cấp thấp sang Trung Quốc không chỉ giúp hạ nhiệt căng thẳng mà còn thể hiện sự nhượng bộ chiến lược sau khi Bắc Kinh dùng đất hiếm làm đòn bẩy. Nvidia H20 và MI308 trở thành quân bài thương lượng, mở ra cơ hội cho hội nghị cấp cao và “thiết lập lại” quan hệ Mỹ-Trung theo mô hình G2, dù những rủi ro kinh tế vẫn còn hiện hữu.

https://www.scmp.com/economy/china-economy/article/3318471/how-easing-ai-chip-controls-could-reshape-us-china-trade-talks

How easing of AI chip controls could reshape US-China trade talks

Beijing’s rare earth curbs turned chips into leverage – paving the way for concessions that could reset ties, analysts say

Luna Sunin Beijing

Published: 11:00pm, 16 Jul 2025

The United States’ decision to ease export restrictions on certain advanced chips – part of a broader package of trade agreements with China – is seen by experts as an early sign that high-level negotiations have steered bilateral relations in the right direction.

Washington’s move to resume license application reviews for Nvidia’s H20 AI and Advanced Micro Devices’s MI308 AI chips comes ahead of talks between senior officials from both nations in the coming weeks, despite a protracted strategic stand-off over tech and export controls.

Zhuang Bo, global macro strategist at Loomis Sayles Investment Asia, said the development was a clear win for China – effectively resetting the clock to March, before rare earths became a geopolitical chokepoint.

“It signals that Beijing is inching closer to the G2-style negotiations it has long sought, framed in official rhetoric as a call for ‘mutual respect and equality.’”

While the reality on the ground has not changed much, the situation has not deteriorated, he added. “Whether there will be a Xi-Trump summit later this year will be crucial. If that happens, a partial agreement is still possible.”

On Tuesday, AMD said the US Department of Commerce was reviewing its licence applications to export MI308 chips to China, and that sales would resume once approved.

Nvidia also hopes to resume deliveries of its made-for-China H20 GPUs soon. “The US government has assured NVIDIA that licences will be granted,” the company said in a statement on Monday.

In an interview with Bloomberg on Tuesday, US Secretary of the Treasury Scott Bessent said the move was “part of a mosaic” of trade agreements that came out of the separate rounds of high-level talks in Geneva and London, where it served as a “negotiating chip”.

“They had things we wanted. We had things they wanted… We are in a very good place… and I tell market participants not to worry about August 12 [the tariff deadline with China],” Bessent said.

Nvidia to resume sales of AI chips to China as CEO visits Beijing

Nvidia to resume selling H20 graphic processing chips to China in boon for AI

Exports of rare earths – a group of critical minerals widely used in electric vehicles, aerospace and advanced electronics – have become a flashpoint in the intensifying US-China trade rivalry in recent months.

Beijing tightened controls on shipments in April, a move widely seen as a countermeasure to US restrictions on advanced semiconductor exports and rising tariffs.

Bessent previously confirmed that China had resumed rare earth magnet exports to the US, although volumes have not yet returned to pre-April levels. He said Nvidia’s H20 could be exported so long as Chinese manufacturers were producing equivalent chips.

US Commerce Secretary Howard Lutnick told CNBC the resumption of chip sales is linked to the rare earth deal. Washington approved the exports because Nvidia’s H20 chips are “not our second-best stuff, not even our third-best” but only the fourth, he said.

“You want to sell the Chinese enough that their developers get addicted to the American technology stack,” Lutnick said. “That’s the thinking.”

Bessent said the focus must now shift to China “opening its markets” and increasing “domestic and consumer production there”.

“The one thing that we do not want is a digital belt and road springing up around the world because other countries or China are substituting for our American chip manufacturers,” he said, adding that he expects to meet China’s vice-premier in a third country in the coming weeks.

Easing H20 export controls is a positive step for both China and the US, and carries even greater strategic significance for Beijing, said Cui Fan, a professor of international trade at the University of International Business and Economics, on his public social media account.

“The US has long followed what I call a policy of marginal control: once China develops products or technologies with similar capabilities, Washington tends to relax restrictions to squeeze the market share of Chinese competitors,” he said.

While China’s domestic AI chips are advancing rapidly, he said, domestic production still struggles to meet demand, particularly in terms of capacity and general-purpose performance.

“The AI sector is evolving at breakneck speed, and the relaxation of H20 controls gives us far more room to coordinate both domestic and international resources and foster greater synergy across the supply chain,” Cui said.

“At the same time, easing restrictions also aligns with the development interests of the US chip industry.”

“Just as the Geneva talks on tariffs marked the beginning of a strategic stalemate in US-China tariffs negotiations, the London discussions may signal a similar phase on export controls,” he added.

Morgan Stanley said in a report published on Tuesday that the H20 decision, along with media reports suggesting US President Donald Trump is considering a visit to China, could be early signs that bilateral relations are moving in a more positive direction.

However, the investment bank cautioned that macroeconomic weaknesses in China persist, including deflationary pressures and a housing slump, while further clarity is needed from coming Politburo meetings and economic data releases.

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute AI pháp lý-quản trị-chủ quyền 2025-07-17 00:23:09

ASML: Mỹ nới lỏng lệnh cấm chip AI với Trung Quốc sẽ thúc đẩy mạnh nhu cầu chip toàn cầu

Giám đốc tài chính của ASML, ông Roger Dassen, nhận định việc Mỹ nới lỏng lệnh cấm bán chip AI cho Trung Quốc sẽ là tín hiệu tích cực với nhu cầu chip toàn cầu.
ASML – công ty Hà Lan sản xuất máy in chip tiên tiến nhất thế giới – sẽ hưởng lợi lớn nếu các khách hàng như Nvidia và AMD gia tăng doanh số tại thị trường Trung Quốc.
Tuần này, Nvidia tuyên bố đã nhận được đảm bảo từ chính phủ Mỹ rằng một số dòng chip từng bị cấm sẽ được phép xuất khẩu lại sang Trung Quốc.
AMD – đối thủ chính của Nvidia – cũng đưa ra thông báo tương tự, cho thấy xu hướng đảo chiều chính sách đang diễn ra mạnh mẽ.
Những giấy phép xuất khẩu này có thể giúp Nvidia và AMD thu về hàng tỷ USD doanh thu chỉ trong năm 2025, đánh dấu sự thay đổi lớn sau khi chính quyền Trump từng tuyên bố không đàm phán vấn đề này.
Dù vậy, ASML cũng vừa điều chỉnh giảm triển vọng tăng trưởng năm 2026, viện dẫn lý do là tình hình kinh tế toàn cầu bất ổn và các yếu tố địa chính trị phức tạp, bao gồm cả các chính sách thuế và kiểm soát xuất khẩu.
Ông Dassen cho biết sự không chắc chắn từ các lệnh cấm là yếu tố ảnh hưởng lớn, nhưng nếu lệnh cấm được gỡ bỏ thì chắc chắn nhu cầu chip toàn cầu sẽ được thúc đẩy mạnh mẽ.
ASML không trực tiếp bán chip nhưng đóng vai trò cốt lõi trong chuỗi cung ứng chip toàn cầu nhờ công nghệ in thạch bản cực tím (EUV) – thiết yếu cho việc sản xuất các chip AI tiên tiến nhất hiện nay.

📌 ASML đánh giá việc Mỹ dỡ bỏ lệnh cấm chip AI với Trung Quốc có thể làm bùng nổ nhu cầu chip toàn cầu, giúp Nvidia và AMD thu thêm hàng tỷ USD. Dù ASML giảm kỳ vọng tăng trưởng 2026 do bất ổn kinh tế, nhưng triển vọng trung hạn sẽ tích cực nếu các rào cản thương mại được tháo gỡ.

https://www.bloomberg.com/news/articles/2025-07-16/asml-cfo-says-easing-china-ai-chip-controls-would-boost-demand

ASML Says Easing China AI Chip Controls Would Boost Demand

By Dasha Afanasieva

July 16, 2025 at 8:01 AM UTC

ASML Holding NV Chief Financial Officer Roger Dassen said it will be positive for chip demand if Washington lifts restrictions on the sale of some artificial intelligence processors to China.

Nvidia Corp. said this week it received assurances that the US government will allow the export of some chips to the Asian nation that had previously been blocked. Advanced Micro Devices Inc., Nvidia’s chief rival, followed with a similar announcement.

ASML makes the world’s most advanced machines for producing chips, and it stands to benefit from higher demand if its customers sell more to China. On Wednesday the Dutch company walked back its forecast for growth in 2026, citing growing economic and geopolitical turbulence.

“We talked about uncertainties, that’s one of those uncertainties,” Dassen said on a call with journalists, referring to the US restrictions. “If that ban were to be lifted, that could be seen as a positive for global chip demand for sure.”

These export license approvals could generate billions of dollars in total revenue for Nvidia and AMD this year and mark a dramatic reversal after the Trump administration said the issue wasn’t even up for debate.

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-07-17 00:03:02

Các công ty Trung Quốc đổ xô đặt mua chip AI H20 của Nvidia khi Mỹ sắp dỡ bỏ lệnh cấm

Các công ty Trung Quốc đang gấp rút đặt hàng chip AI H20 của Nvidia khi hãng này chuẩn bị nối lại hoạt động bán hàng tại Trung Quốc, nhờ vào khả năng được cấp phép từ chính phủ Mỹ trong thời gian tới.
CEO Jensen Huang của Nvidia vừa gặp cựu Tổng thống Donald Trump – một sự kiện quan trọng được cho là đã thúc đẩy tiến trình cấp phép trở lại cho các dòng chip AI bị hạn chế xuất khẩu.
Nếu việc xuất khẩu được nối lại, Nvidia có thể thu về thêm 15 đến 20 tỷ USD trong năm nay.
Nvidia cho biết họ đang nộp hồ sơ xin giấy phép và được chính phủ Mỹ "đảm bảo rằng sẽ được cấp", dự kiến bắt đầu giao hàng sớm.
H20 là dòng chip AI mạnh nhất mà Nvidia có thể bán hợp pháp tại Trung Quốc, dù bị giới hạn sức mạnh tính toán để tuân thủ lệnh cấm xuất khẩu từ năm 2022.
Các công ty lớn như ByteDance và Tencent đang gấp rút đặt mua chip này thông qua một "danh sách được phê duyệt" do Nvidia quản lý.
Huang phát biểu trên đài CCTV rằng "thị trường Trung Quốc rộng lớn, năng động và đổi mới", đồng thời nhấn mạnh tầm quan trọng của việc duy trì sự hiện diện tại đây.
Trước đó vào tháng 4, dòng chip này từng bị cấm khiến Nvidia phải ghi nhận khoản xóa sổ lên đến 4,5 tỷ USD do hàng tồn kho và cam kết mua hàng.
Trung Quốc đã mang lại cho Nvidia 17 tỷ USD doanh thu trong năm tài chính kết thúc ngày 26/1, chiếm 13% tổng doanh thu toàn cầu.
Nvidia cũng sẽ ra mắt chip mới mang tên "RTX Pro", thiết kế riêng cho thị trường Trung Quốc để đáp ứng quy định xuất khẩu – tuy nhiên chưa công bố thông số cụ thể.

📌 Nvidia sắp nối lại việc bán chip H20 tại Trung Quốc sau cuộc gặp giữa CEO Jensen Huang và Donald Trump, dự kiến thu thêm 15–20 tỷ USD. H20 là phiên bản giới hạn để tránh lệnh cấm, hiện được các công ty như ByteDance và Tencent tranh mua. Trung Quốc chiếm 13% doanh thu của Nvidia, tương đương 17 tỷ USD. Nvidia cũng lên kế hoạch ra mắt dòng chip RTX Pro riêng cho thị trường Trung Quốc.

https://arstechnica.com/information-technology/2025/07/nvidia-to-resume-china-ai-chip-sales-after-huang-meets-trump/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-07-16 08:50:03

Mỹ cho AMD xuất khẩu lại chip AI MI308 sang Trung Quốc sau thiệt hại 800 triệu USD

AMD xác nhận ngày 15/07/2025 rằng Bộ Thương mại Mỹ sẽ xem xét lại các đơn xin cấp phép xuất khẩu chip AI MI308 sang Trung Quốc, sau khi bị ngừng từ tháng 4/2025.
Cổ phiếu AMD tăng hơn 6% ngay sau thông tin, thể hiện sự lạc quan của thị trường về việc khôi phục doanh thu tại Trung Quốc.
AMD trước đó cho biết lệnh cấm MI308 khiến công ty chịu thiệt hại lên tới 800 triệu USD, trong khi đối thủ Nvidia mất khoảng 5,5 tỷ USD từ lệnh cấm chip H20.
MI308 là dòng chip tăng tốc AI dành riêng cho thị trường Trung Quốc, được phát triển để phù hợp với quy định kiểm soát xuất khẩu trước đó.
Lệnh cấm mới ban hành đầu năm 2025 do chính quyền Trump, nhằm đảm bảo an ninh quốc gia, đồng thời hủy bỏ “quy tắc khuếch tán AI” do chính quyền Biden đưa ra trước đó.
Chính phủ Mỹ tuyên bố sẽ áp dụng các quy định đơn giản hơn, rõ ràng hơn về xuất khẩu chip AI, nhưng hiện vẫn chưa công bố chính sách toàn diện.
Việc nới lỏng diễn ra ngay sau cuộc gặp giữa CEO Nvidia Jensen Huang và Tổng thống Trump, cho thấy ngành bán dẫn đang vận động hành lang để giảm căng thẳng thương mại.
AMD cho biết họ sẽ nối lại việc giao hàng MI308 ngay sau khi được phê duyệt, đồng thời CEO Lisa Su sẽ tham dự sự kiện AI với ông Trump tại Washington vào tuần tới.
Cả MI308 và H20 đều được các nhà phát triển AI tại Trung Quốc ưa chuộng do tương thích cao và hiệu năng tốt, trong bối cảnh Trung Quốc thúc đẩy thay thế công nghệ Mỹ bằng sản phẩm nội địa như Huawei.
Sự thay đổi này cho thấy dấu hiệu "giảm nhiệt" trong căng thẳng công nghệ Mỹ - Trung, khi cả hai bên đều nhận ra rủi ro từ việc cắt đứt chuỗi cung ứng AI toàn cầu.

📌 AMD sẽ nối lại xuất khẩu chip MI308 sang Trung Quốc sau khi Mỹ xem xét lại giấy phép, giúp công ty giảm thiệt hại lên tới 800 triệu USD. Cùng với Nvidia, AMD là hãng chip tiếp theo được nới lỏng hạn chế xuất khẩu AI trong bối cảnh căng thẳng công nghệ Mỹ – Trung bắt đầu hạ nhiệt và chính quyền Trump cân nhắc quy định chip đơn giản hơn.

https://www.cnbc.com/2025/07/15/amd-mi308-ai-chip-china.html

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-07-16 08:46:46

Mỹ cho phép Nvidia nối lại việc bán chip AI H20 tại Trung Quốc sau lệnh cấm

Chính quyền Trump đã cho phép Nvidia tiếp tục bán chip H20 tại Trung Quốc, sau khi áp lệnh hạn chế xuất khẩu vào tháng 4/2025 khiến hãng phải ghi nhận khoản lỗ 4,5 tỷ USD (~4,5 tỉ USD) trong quý I.
Chip H20 được thiết kế riêng cho thị trường Trung Quốc, nhằm tuân thủ quy định kiểm soát xuất khẩu bán dẫn nâng cao trước đó. Tuy nhiên, lệnh siết chặt bất ngờ vào tháng 4 đã khiến Nvidia phải ngừng giao hàng.
Sau nhiều tháng vận động hành lang, Nvidia đã thuyết phục chính quyền Mỹ rằng cắt nguồn chip Mỹ sẽ khiến Trung Quốc quay sang dùng công nghệ nội địa như Huawei, từ đó đe dọa vị thế AI của Mỹ.
CEO Jensen Huang tuyên bố: “Mỗi mô hình AI dân sự nên vận hành tốt nhất trên nền tảng công nghệ Mỹ”, thúc đẩy các quốc gia chọn giải pháp AI của Hoa Kỳ.
Huang hiện đang ở Bắc Kinh, gặp gỡ khách hàng và quan chức chính phủ Trung Quốc để cập nhật kế hoạch điều chỉnh thị trường. Ông cũng tìm cách gặp Thủ tướng Lý Cường, dấu hiệu cho thấy vai trò ngoại giao ngày càng lớn của ông trong cạnh tranh công nghệ Mỹ - Trung.
Nvidia đồng thời thông báo sẽ ra mắt một dòng chip GPU chơi game mới dành riêng cho Trung Quốc, dựa trên Blackwell RTX Pro 6000, đáp ứng tiêu chuẩn xuất khẩu mới.
GPU chơi game của Nvidia đang được các nhà phát triển AI tại Trung Quốc dùng thay thế cho chip AI chính thống, do khó tiếp cận các dòng H100 hoặc H20.
Chip H20 tuy yếu hơn so với dòng cao cấp, nhưng vẫn được săn đón tại Trung Quốc, đặc biệt sau khi mô hình DeepSeek R1 ra mắt đầu năm, kích thích nhu cầu AI tăng vọt.
Dù Bắc Kinh đang thúc đẩy sử dụng chip nội địa từ Huawei, Cambricon và Biren, Nvidia vẫn là lựa chọn ưu tiên nhờ hệ sinh thái phần mềm vượt trội giúp huấn luyện và triển khai mô hình dễ dàng hơn.
Ngoài chip AI, Nvidia cũng đang có kế hoạch đầu tư vào sản xuất trong nước Mỹ – một chủ đề được thảo luận trong cuộc gặp giữa Huang và Tổng thống Trump gần đây.

📌 Nvidia được phép nối lại xuất khẩu chip H20 sang Trung Quốc sau lệnh cấm từng khiến hãng thiệt hại 4,5 tỷ USD. CEO Jensen Huang hiện đóng vai trò ngoại giao trong cuộc chiến công nghệ Mỹ - Trung, đồng thời thúc đẩy chip mới cho Trung Quốc dựa trên Blackwell. Dù cạnh tranh nội địa gia tăng, Nvidia vẫn là lựa chọn ưu tiên nhờ hệ sinh thái AI mạnh và phần mềm dễ tích hợp.

https://www.ft.com/content/ba0929bd-5912-44fb-9048-c143aced4c8a

Nvidia gets nod from Washington to resume sales of H20 China chip

Leading AI chipmaker took $4.5bn writedown after tightening US export controls banned sales of its key product

Eleanor Olcott in Beijing and Joe Miller in Washington

Nvidia has said the Trump administration has relaxed restrictions on exporting a key artificial intelligence product designed specifically for the Chinese market, saying it hoped to resume deliveries of its H20 chip “soon”.

The US chipmaker on Tuesday said it had received assurances from the US government that it would approve licences for the H20, while announcing plans to release a new China-specific AI chip.

Nvidia reported a $4.5bn charge in the first quarter after Washington restricted its ability to sell its H20 chip to China in April, which had been designed to comply with a previous version of export controls on advanced semiconductors.

The assurances come after intense lobbying by the US chipmaker, warning that America risked forfeiting its leadership in AI to Chinese companies, including Huawei, by cutting off exports of critical technology.

“We believe that every civil model should run best on the US technology stack, encouraging nations worldwide to choose America,” Nvidia’s chief Jensen Huang said in a statement on Tuesday.

Huang is in Beijing meeting government officials and Chinese customers this week to give them an update on how it plans to address the local market. The trip follows a meeting between Huang and President Trump, where Nvidia’s commitment to investing in US manufacturing was discussed, the company said.

Huang is seeking talks with Premier Li Qiang this week, who would be the most senior Chinese official he has met to date, as the chief executive takes on an increasingly diplomatic role navigating US-China tech competition.

Nvidia also announced plans to release a new gaming graphic processing unit (GPU) for the Chinese market that is compliant with US export controls. Last week, the FT reported news of Nvidia’s plans to release an updated chip designed for China, based on its Blackwell RTX Pro 6000 processor.

Nvidia’s gaming chips have become a popular option for developers to run small Al models, given difficulties purchasing the company’s chips tailored for Al workloads.

Huang said the new chip could be used for applications including advanced manufacturing and logistics.

The H20 chip is less powerful than its top-of-the-range GPUs, but still saw strong demand in China, particularly in the wake of DeepSeek’s R1 model release in January, which caused a surge in AI usage in the country.

Beijing has taken steps to encourage the purchasing of local AI chips from rivals, including Huawei and smaller companies, including Cambricon and Biren. But Nvidia’s AI chip remains the preferred option for AI workloads, given its strong software ecosystem that makes it easier to train and run models.

The White House and the US Department of Commerce did not immediately respond to requests for comment.

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-07-16 08:30:23

Google chi 25 tỷ USD đầu tư trung tâm dữ liệu và hạ tầng AI trên hệ thống điện lớn nhất nước Mỹ

Ngày 15/07/2025, Google công bố sẽ đầu tư 25 tỷ USD trong vòng hai năm để xây dựng trung tâm dữ liệu và hạ tầng AI tại khu vực thuộc PJM Interconnection, hệ thống lưới điện lớn nhất Hoa Kỳ.
PJM bao phủ 13 bang từ miền Trung Đại Tây Dương đến Trung Tây và miền Nam, bao gồm thị trường trung tâm dữ liệu lớn nhất thế giới ở miền Bắc Virginia.
Ngoài ra, Google sẽ chi 3 tỷ USD để hiện đại hóa hai nhà máy thủy điện tại Pennsylvania, hỗ trợ nhu cầu điện gia tăng từ các trung tâm dữ liệu.
Thỏa thuận này là một phần trong hợp tác khung với Brookfield Asset Management, cho phép Google mua tới 3.000 megawatt thủy điện trên toàn nước Mỹ.
Mục tiêu là giải quyết áp lực thiếu điện tại PJM, vốn đang vật lộn với nhu cầu điện bùng nổ từ ngành AI và công nghiệp trung tâm dữ liệu.
Cùng ngày, Tổng thống Donald Trump cùng nhiều lãnh đạo công nghệ, năng lượng và các quan chức chính phủ họp tại Đại học Carnegie Mellon, Pittsburgh, để bàn về chiến lược AI tại Pennsylvania.
Ruth Porat, Chủ tịch kiêm Giám đốc đầu tư của Alphabet & Google, cũng tham dự hội nghị, đại diện cho các cam kết đầu tư lớn của Google tại khu vực.
Tổng cộng, hơn 90 tỷ USD đầu tư mới vào trung tâm dữ liệu, năng lượng và hạ tầng AI đã được công bố tại sự kiện, theo văn phòng Thượng nghị sĩ Dave McCormick – người tổ chức hội nghị.

📌 Google cam kết đầu tư 25 tỷ USD cho hạ tầng AI tại khu vực PJM – nơi có hệ thống điện lớn nhất nước Mỹ, đồng thời chi thêm 3 tỷ USD để nâng cấp thủy điện tại Pennsylvania. Thỏa thuận mua 3.000 MW thủy điện giúp đảm bảo điện sạch cho trung tâm dữ liệu, trong bối cảnh nhu cầu AI tăng mạnh và lưới điện PJM đang chịu áp lực cực lớn.

https://www.cnbc.com/2025/07/15/google-to-invest-25-billion-in-data-centers-ai-infrastructure-in-pjm.html

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute AI pháp lý-quản trị-chủ quyền 2025-07-14 09:08:15

Nvidia kiếm đậm từ "AI chủ quyền quốc gia", nhưng liệu tiền thuế dân có bị đổ vào lâu đài ảo?

Từ cuối năm 2023, CEO Nvidia Jensen Huang đã thúc đẩy ý tưởng "sovereign AI" (AI chủ quyền quốc gia): các hệ thống AI được huấn luyện bằng dữ liệu nội địa, hạ tầng địa phương, và phản ánh giá trị quốc gia.
Liên minh châu Âu đã công bố quỹ 20 tỷ euro (23 tỷ USD) để xây 5 "AI gigafactory". Gần đây, Pháp, Đức, UAE, Ả Rập Xê Út và Hàn Quốc đều đã ký thỏa thuận xây dựng hạ tầng AI quốc gia.
Theo Nvidia, ít nhất 20 quốc gia đang theo đuổi chiến lược này. Jefferies ước tính, doanh thu từ mảng này có thể đạt 200 tỷ USD, còn Nvidia kỳ vọng con số lên đến 1.000 tỷ USD trong dài hạn.
Các lý do được đưa ra: muốn bảo mật dữ liệu nhạy cảm (như y tế), tạo mô hình AI phản ánh ngôn ngữ và giá trị địa phương và mở rộng quyền truy cập AI cho viện nghiên cứu và doanh nghiệp nhỏ.
Ví dụ: Pháp dựa vào startup nội địa Mistral cùng Nvidia để xây trung tâm dữ liệu AI lớn nhất châu Âu. UAE giao dự án cho G42, còn Ả Rập Xê Út thành lập công ty AI quốc doanh Humain.
Tuy nhiên, đa số quốc gia vẫn phụ thuộc hoàn toàn vào chip và hạ tầng Mỹ: Nvidia chiếm 90% thị trường chip AI, còn máy chủ phần lớn do Dell và Supermicro cung cấp.
Các "đám mây chủ quyền" do Amazon, Microsoft phát triển có thể cung cấp chức năng tương tự với chi phí và hiệu quả cao hơn.
Chuyên gia Kevin Xu cảnh báo: nhiều dự án đang nguy cơ thành "lâu đài" hào nhoáng thay vì nhà máy hiệu quả, tạo gánh nặng cho ngân sách mà lại phục vụ lợi ích Nvidia nhiều hơn.

📌 Ý tưởng “AI quốc gia” mang lại đơn hàng lớn cho Nvidia, nhưng hiệu quả thực sự với người dân vẫn bị nghi ngờ. Dù giúp bảo vệ dữ liệu và mở rộng quyền truy cập công nghệ, các dự án vẫn phụ thuộc vào chip Mỹ và dễ trở thành biểu tượng tốn kém thay vì giải pháp bền vững.

https://www.economist.com/business/2025/07/13/meet-nvidias-big-new-customers-governments

Meet Nvidia’s big new customers: governments

But will “sovereign” AI pay off for taxpayers?

Jul 13th 2025|4 min read

Late in 2023 Jensen Huang, chief executive of Nvidia, began peddling a new idea. Every country, he said, should have its own artificial-intelligence (AI) system, trained on domestic data, aligned with national values and built using local infrastructure. Appealing to policymakers’ fondness for manufacturing, the boss of the chip colossus described these systems as “AI factories”, ingesting data and churning out intelligence. He called it “sovereign AI”.

Politicians are warming to the idea. Earlier this year the European Commission unveiled plans for a €20bn ($23bn) fund to build up to five “AI gigafactories”. In just the past two months the governments of France, Germany, Saudi Arabia, South Korea and the United Arab Emirates (uae) have all been involved in deals to build local AI infrastructure (see chart). According to Nvidia, at least 20 countries are pursuing the idea of sovereign AI.

The reason for Mr Huang’s enthusiasm is clear. For Nvidia, which this month became the first company to reach a $4trn market value, governments are a potentially lucrative source of business. Jefferies, an investment bank, estimates that sovereign initiatives could generate some $200bn in cumulative revenue for the chipmaker “over the coming years”; the company believes that spending could reach $1trn over an equally fuzzy period.

Sovereign ai could also act as a welcome hedge for Mr Huang. His biggest customers—Amazon, Alphabet, Meta and Microsoft—are all developing their own chips, which could in time reduce their reliance on Nvidia. Saudi Arabia expects to purchase “several hundred thousand” of Nvidia’s top-end processors over the next five years. The UAE, with perhaps the most ambitious plans of all, intends to import half a million annually.

But will sovereign ai pay off for taxpayers? Despite growing enthusiasm, the concept remains woolly. Sovereign AI may help countries develop national models, protect sensitive information and widen access to the technology. But it will do little to reduce countries’ dependence on America and, in many cases, risks wasting vast sums of money.

There are subtle variations in how governments are pursuing sovereign AI. France’s approach centres on Mistral, a domestic model-maker, which has formed a consortium with Bpifrance, a government bank, MGX, an Emirati state-owned investment firm, and Nvidia to build what has been touted as Europe’s largest AI data campus. In the Gulf, governments have taken more direct control. In May Saudi Arabia launched Humain, a firm tasked with building AI infrastructure in the kingdom. In the UAE that role has fallen to G42, an AI firm part-owned by Mubadala, a sovereign-wealth fund.

Governments justify these projects on various grounds. A few big spenders want to catch up to America: the European Commission, for instance, hopes to propel Europe to the “forefront of AI development”. Others, such as India, worry that AI models trained on foreign, and especially English-language, data will not reflect local languages and values, a growing concern as AI systems come to shape everything from education to public services. A degree of control over domestic data is also viewed as essential. In areas such as health care, officials worry about patients’ information being plugged into foreign models. A homegrown system, some contend, makes it easier to protect such information while still allowing it to be used to train AI models.

A final concern for governments is to widen access to AI systems. Nadia Carlsten, chief executive of the DCAI, which runs Gefion, Denmark’s national AI supercomputer, says that smaller companies and research institutes are “always at the back of the line”. A domestic offering, she argues, helps ensure cheaper and more reliable access for such users. Gefion, launched in 2024, is being used for applications such as drug discovery and weather forecasting.

Yet these initiatives will not offer anything close to self-sufficiency. Cutting-edge processors are the most important requirement for advanced AI systems. Nvidia dominates that market, accounting for about 90% of all commercially available AI chips—which is why it has played a central role in nearly all sovereign-AI initiatives. Its only serious rival, AMD, is also American. The servers that house these chips are mostly built by another two American companies, Dell and Supermicro. Even China, which has built something close to a self-sufficient AI stack, has yet to develop a domestic alternative to America’s whizziest chips.

Sovereign-AI projects may well help governments achieve more modest objectives, such as keeping data secure and ensuring access to the technology for groups such as researchers. But America’s cloud giants could probably provide this more efficiently—not least because their scale gives them bargaining power over suppliers such as Nvidia. Indeed, Amazon and Microsoft are already pitching sovereign clouds with enhanced controls over data and dedicated local infrastructure. National AI models could simply be built on top of these.

Kevin Xu of Interconnected Capital, a hedge fund, warns that many sovereign-AI projects risk creating something “more like a palace than a factory”. That would be a poor use of taxpayers’ money—but it might suit Nvidia just fine. ■

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-07-13 08:40:05

Indonesia bắt tay NVIDIA và Cisco xây trung tâm AI có chủ quyền

Indonesia đang thúc đẩy tham vọng “Tầm nhìn Vàng 2045” với mục tiêu trở thành cường quốc kỹ thuật số thông qua việc xây dựng hạ tầng AI và phát triển nhân tài bản địa.
Trung tâm Xuất sắc AI (AI Center of Excellence - CoE) chính thức ra mắt với sự hợp tác của Indosat Ooredoo Hutchison (IOH), Cisco, NVIDIA và sự hỗ trợ của Bộ Truyền thông và Kỹ thuật số (Komdigi).
NVIDIA đóng vai trò then chốt với việc triển khai Trung tâm Công nghệ AI và chương trình đào tạo chuyên sâu từ Deep Learning Institute cùng chương trình hỗ trợ startup NVIDIA Inception.
CoE sẽ hoạt động trên nền tảng NVIDIA AI toàn diện gồm GPU Blackwell, kiến trúc tham chiếu đám mây, phần mềm NVIDIA AI Enterprise và hệ thống an ninh tích hợp của Cisco.
Cisco thiết lập Nền tảng đám mây An ninh Chủ quyền sử dụng AI phát hiện mối đe dọa và kiểm soát dữ liệu nội địa.
4 trụ cột chính của chiến lược:
1. Hạ tầng AI có chủ quyền: hiệu năng cao, bảo mật, phù hợp với mục tiêu số hóa quốc gia
2. Khối lượng công việc AI an toàn: bảo vệ tài sản trí tuệ và dữ liệu quốc gia
3. AI cho tất cả: cung cấp AI tới hàng trăm triệu người dân trước 2027
4. Hệ sinh thái nhân tài: đào tạo 1 triệu người có kỹ năng số và AI trước 2027
28 công ty và startup phần mềm đang khai thác hạ tầng AI của IOH để phục vụ giáo dục, y tế, đô thị thông minh, an ninh thực phẩm và cải cách hành chính.
Indosat triển khai các ứng dụng LLM tiếng Bahasa qua bộ Sahabat-AI, kết hợp cùng Hippocratic AI để cung cấp AI chăm sóc sức khỏe dự phòng cho phụ nữ trên 50 tuổi.
Chatbot của Indosat hỗ trợ người dân tra cứu thông tin về giấy tờ tùy thân, thuế và các dịch vụ công bằng tiếng Indonesia.
Chính phủ Indonesia cũng đang phát triển khung chính sách AI tin cậy, phù hợp giá trị văn hóa bản địa.
Kế hoạch tương lai là triển khai công nghệ AI-RAN (AI qua mạng không dây) để tiếp cận nhiều người dùng hơn.

📌 Indonesia đẩy mạnh chiến lược AI quốc gia với trung tâm AI do NVIDIA và Cisco hỗ trợ, mục tiêu đào tạo 1 triệu người, cung cấp AI cho hàng trăm triệu dân trước năm 2027. Với nền tảng LLM tiếng bản địa và AI-RAN, nước này đang xây dựng hệ sinh thái AI có chủ quyền, an toàn và toàn diện.

https://blogs.nvidia.com/blog/indonesia-ai-center-of-excellence/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute STI 2025-07-11 17:12:24

Trung Quốc bơm 41 tỷ USD vào ngành chip: quyết phá thế phụ thuộc và tự sản xuất thiết bị như ASML

Trung Quốc tuyên bố đầu tư kỷ lục 41 tỷ USD để phát triển thiết bị sản xuất chip nội địa, nhằm phá thế phụ thuộc vào công nghệ phương Tây và đạt tự chủ bán dẫn.
Chip bán dẫn không chỉ là linh kiện, mà còn là đòn bẩy quyền lực số trong thời đại công nghệ hiện nay – từ điện thoại, xe điện đến AI và vũ khí quân sự.
Trung Quốc bắt đầu bơm vốn cho ngành bán dẫn từ năm 2014, nhưng đây là khoản đầu tư tập trung lớn nhất từ trước đến nay, nhắm trực tiếp vào thiết bị chế tạo chip, lĩnh vực mà nước này đang yếu thế.
Trung tâm của kế hoạch là SMIC – Tập đoàn Sản xuất Bán dẫn Quốc tế Trung Quốc – tương tự như Intel ở phương Tây. Tuy nhiên, SMIC không được tiếp cận công nghệ EUV tiên tiến do ASML (Hà Lan) sản xuất, vì bị Mỹ và đồng minh chặn xuất khẩu.
Máy EUV của ASML có giá khoảng 300 triệu USD/chiếc, là công cụ không thể thiếu để sản xuất chip 2nm và nhỏ hơn.
Naura, Hua Hong và AMEC đang cùng SMIC phát triển thiết bị thay thế ASML, dù thừa nhận việc này như “chạy lại từ đầu trong khi đối thủ đã gần về đích”.
Huawei Mate 60 Pro là bước ngoặt công nghệ: dùng chip 5G nội địa do Trung Quốc tự phát triển, bất chấp lệnh trừng phạt, chứng minh nước này có khả năng kháng cự và phục hồi.
Trong khi đó, phương Tây cũng tăng tốc: ASML phát triển thế hệ máy in quang khắc mới High-NA EUV, dự kiến ra mắt giữa thập kỷ, hỗ trợ sản xuất chip tiên tiến hơn nữa.
Trung Quốc xem chip là điểm yếu chiến lược – không chỉ vì kinh tế, mà còn vì quốc phòng và ngoại giao. Tự chủ sản xuất chip đồng nghĩa với giảm phụ thuộc và tăng sức mạnh quốc gia.
Dù mất cả thập kỷ để bắt kịp công nghệ phương Tây, Trung Quốc vẫn theo đuổi chiến lược dài hạn, coi đây là “cuộc chiến sống còn” trên mặt trận công nghệ và địa chính trị.

📌 Trung Quốc đầu tư 41 tỷ USD để phát triển thiết bị sản xuất chip nội địa, tập trung vào SMIC và các công ty công nghệ trong nước nhằm thay thế máy EUV từ ASML. Dù bị Mỹ chặn nguồn cung, Trung Quốc đang đặt cược dài hạn để đạt tự chủ bán dẫn, củng cố sức mạnh công nghệ và giảm rủi ro chiến lược trước các trừng phạt từ phương Tây.

https://www.decaturmetro.com/chinas-massive-tech-move-41-billion-invested-in-homegrown-chip-gear/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-07-11 07:57:12

Temasek (Singapore) đang mở rộng đầu tư vào AI và hạ tầng core-plus

Temasek (Singapore) đang mở rộng đầu tư vào AI và hạ tầng core-plus, coi đây là những lĩnh vực "có tiềm năng lớn trong hai thập kỷ tới", theo phó CEO Chia Song Hwee.
36% danh mục đầu tư của Temasek là đầu tư trực tiếp toàn cầu; 41% từ các công ty nội địa Singapore và 23% là các quỹ/đối tác quản lý tài sản.
Trong lĩnh vực AI, Temasek tập trung vào toàn bộ chuỗi giá trị, bao gồm:
- Các công ty AI tăng trưởng cấp số nhân.
- Hạ tầng vật lý hỗ trợ AI.
- Những startup AI mới nổi có thể tạo ra đột phá.
Temasek đã đầu tư vào những công ty như Nvidia (sản xuất chip) và Intapp (phần mềm AI).
Năm 2021, Temasek thành lập công ty Aicadium chuyên cung cấp giải pháp AI cho các công ty trong danh mục đầu tư.
Đồng thời, họ đầu tư vào quỹ AI Infrastructure Partnership cùng Microsoft và BlackRock để phát triển hạ tầng AI.
Về hạ tầng core-plus, Temasek nhắm đến các tài sản có rủi ro thấp hơn đầu tư tăng trưởng nhưng cao hơn hạ tầng truyền thống như:
- Trung tâm dữ liệu.
- Hạ tầng chuyển đổi năng lượng.
- Hạ tầng cũ cần thay thế.
Temasek triển khai vốn qua ba hình thức: đầu tư trực tiếp thông qua các công ty có chuyên môn sâu, đầu tư vào quỹ, và hợp tác cùng các nhà đầu tư lớn khác như Brookfield (góp vốn vào công ty năng lượng tái tạo Neoen của Pháp).
Ưu tiên đầu tư vào các công ty có:
- Dòng tiền ổn định.
- Thị trường nội địa lớn.
- Chuỗi cung ứng bền vững và ít chịu ảnh hưởng địa chính trị.
Ngoài ra, Temasek đẩy mạnh đầu tư thay thế như:
- Tín dụng tư nhân.
- Quỹ đầu tư tư nhân.
- Giải pháp lai và chiến lược phi tương quan như quỹ phòng hộ, bảo hiểm khối đóng và bản quyền.

📌 Temasek đẩy mạnh đầu tư vào AI và hạ tầng core-plus, chiếm 36% danh mục đầu tư toàn cầu. Các khoản đầu tư nổi bật bao gồm Nvidia, Aicadium và AI Infrastructure Partnership. Với chiến lược tập trung vào dòng tiền ổn định và thị trường bền vững, Temasek xem đây là cơ hội kéo dài 20 năm, đồng thời đa dạng hóa qua các kênh đầu tư thay thế như tín dụng tư nhân và quỹ phòng hộ.

https://www.businesstimes.com.sg/companies-markets/temasek-increase-exposure-ai-core-plus-infrastructure

Temasek to increase exposure in AI, core-plus infrastructure

Artificial intelligence is a ‘two-decade opportunity’, says deputy CEO Chia Song Hwee

Navene Elangovan

Published Wed, Jul 9, 2025 · 03:00 PM

[SINGAPORE] Singapore investment company Temasek is increasing its exposure to “promising opportunities” in artificial intelligence (AI) and core-plus infrastructure.

AI is a “two-decade opportunity” with the potential to transform industries, said Chia Song Hwee, the deputy chief executive officer of Temasek. Core-plus infrastructure “provides resilient, risk-adjusted returns and stable cash use”, said Temasek’s management in a media briefing for the launch of its annual Temasek Review released on Wednesday (Jul 9).

These asset classes are part of Temasek’s global direct investments, which make up 36 per cent of its portfolio. Temasek’s Singapore-based portfolio companies and partnerships with other investors and asset management companies make up 41 and 23 per cent of its portfolio, respectively.

In the AI space, Temasek is looking to increase its opportunities across the value chain. This includes AI companies that are growing at an “exponential pace”, physical infrastructure to support AI and emerging AI innovators that can disrupt the market. Some of the companies that Temasek has already invested in include chipmaker Nvidia and software company Intapp.

Temasek has set up AI-related ventures which can work with its portfolio companies to improve their value. For example, it founded software company Aicadium in 2021 to provide AI solutions to companies. It has also invested in AI funds such as AI Infrastructure Partnership, which is backed by Microsoft and BlackRock.

Core-plus infrastructure

Temasek is also looking at core-plus infrastructure, a type of infrastructure asset class that is riskier than traditional infrastructure, but safer than growth infrastructure investments. They include assets such as data centres, infrastructure to support energy transition infrastructure and ageing infrastructure that needs to be replaced.

Temasek is deploying its capital into this asset class in a few ways. It is doing so directly through its portfolio companies that have deep expertise in the area and through investments in funds. It is also partnering global investors, such as in its partnership with Brookfield to acquire a stake in French renewable energy producer Neoen.

Lim Ming Pey, the chief of staff at Temasek’s executive office, told The Business Times that when it comes to its global direct investments, Temasek prefers to invest in companies that have a track record of stable cash flow, have access to a large domestic market, and have a relatively resilient supply chain.

“Such companies are better protected against the risk of tariffs or other geopolitical impacts,” said Lim.

In the past year, Temasek has invested in Indian snack company Haldiram’s, Neoen and China’s largest restaurant operator Yum China.

Alternative assets will also be an “important return driver” for Temasek in the years ahead, said Lim. These assets mostly form the third segment of its portfolio, which consists of investments in funds, partnerships with other investors and asset management companies.

Alternative investments help to diversify Temasek’s portfolio beyond equities and potentially generate higher risk-adjusted returns.

To that end, Temasek is increasing its exposure in areas such as private credit and hybrid solutions, private equity funds, as well as liquid alternatives and uncorrelated strategies that include hedge funds, closed block insurance and royalties.

Không có file đính kèm.

Nguồn tham khảo

AI market AI chips-hardware-compute 2025-07-11 00:07:40

Huawei âm thầm xuất khẩu chip AI sang Trung Đông và Đông Nam Á bất chấp kiểm soát của Mỹ

Huawei đang cố gắng thâm nhập thị trường AI ở Trung Đông và Đông Nam Á bằng cách chào bán chip AI Ascend 910B cũ với số lượng nhỏ, chủ yếu là vài ngàn đơn vị mỗi quốc gia.
Các quốc gia được Huawei nhắm đến bao gồm UAE, Ả Rập Xê Út, Thái Lan và Malaysia, trong đó chỉ có Ả Rập Xê Út được cho là đang ở giai đoạn đàm phán “tiến triển”.
Huawei cũng cung cấp quyền truy cập từ xa vào hệ thống AI CloudMatrix 384 dùng chip Ascend 910C, nhưng chưa xuất khẩu loại chip này do thiếu nguồn cung.
UAE và đại học AI Mohamed bin Zayed tỏ ra không quan tâm đến lời chào hàng từ Huawei, trong khi thông tin về Thái Lan và Malaysia chưa rõ ràng.
Dù vậy, một quan chức của Mỹ cho biết Huawei chỉ có khả năng sản xuất 200.000 chip AI trong năm nay, phục vụ chủ yếu cho thị trường nội địa Trung Quốc.
Huawei đã tích trữ được 2,9 triệu chip Ascend 910B thông qua TSMC, mặc dù số lượng đó chưa được tung ra thị trường.
Mỹ đang rất quan tâm đến các dự án hạ tầng AI tại Trung Đông và Đông Nam Á do lo ngại ảnh hưởng từ Trung Quốc. Các quốc gia này có quan hệ lâu dài với Huawei nhưng đồng thời cũng nhận được sự hỗ trợ chip từ Mỹ.
Chính quyền Trump đang thúc đẩy luật yêu cầu giấy phép xuất khẩu chip AI sang Thái Lan và Malaysia, theo một bản dự thảo của Bộ Thương mại Mỹ.
Một số quan chức Mỹ muốn đẩy nhanh quá trình xuất khẩu chip Mỹ để không để Huawei “giành khách hàng trước”, nhưng vẫn có luồng ý kiến khác lo ngại việc cung cấp chip Mỹ sẽ bị lợi dụng để hỗ trợ Trung Quốc.
Malaysia từng thông báo kế hoạch sử dụng 3.000 chip Ascend đến năm 2026 cho mạng lưới AI quốc gia, nhưng chính phủ đã né tránh xác nhận và Huawei cũng phủ nhận việc đã giao hàng.

📌 Huawei đang âm thầm thử nghiệm xuất khẩu chip AI Ascend 910B sang các thị trường nước ngoài như UAE, Ả Rập Xê Út, Thái Lan và Malaysia với số lượng giới hạn, trong bối cảnh sản xuất chỉ đạt 200.000 chip trong năm 2025. Mỹ vẫn siết chặt kiểm soát, song Ả Rập Xê Út là điểm sáng hiếm hoi có thể tiếp nhận. Huawei dùng chiến lược “gieo mầm” công nghệ, kỳ vọng tăng thị phần AI toàn cầu trong tương lai.

https://www.bloomberg.com/news/articles/2025-07-10/huawei-seeks-ai-chip-customers-in-middle-east-southeast-asia

Huawei Seeks AI Chip Customers in Middle East, Southeast Asia

By Mackenzie Hawkins and Yuan Gao

July 10, 2025 at 2:35 PM UTC

Huawei Technologies Co. is trying to export small quantities of AI chips to the Middle East and Southeast Asia, an effort to establish a foothold in markets dominated by Nvidia Corp. despite ongoing manufacturing challenges.

The hardware giant — China’s strongest competitor to leading US chipmakers — has reached out to potential customers in the United Arab Emirates, Saudi Arabia and Thailand about purchasing its older-generation Ascend 910B processors, according to people familiar with the matter. The two Gulf nations recently struck deals for well over a million Nvidia and Advanced Micro Devices Inc. chips over several years. Thailand’s artificial intelligence efforts similarly rely on Nvidia.

Huawei is offering 910B volumes in the low thousands, according to the people, though the exact number for any particular pitch remains unclear. The company is also trying to woo customers with remote access to CloudMatrix 384, the people said. That’s a China-based AI system built with more advanced Ascend 910C chips — which Huawei isn’t currently prepared to export due to limited supplies, according to a person familiar with the company’s thinking. Huawei is focused on selling 910Cs to Chinese firms that can’t access best-in-class American chips, the person said.

Huawei’s efforts haven’t produced any finalized deals, the people said — though they indicate the company, which Nvidia has called a formidable competitor, wants to give foreign AI markets a taste of its technology as it works to boost manufacturing output. The proposals also have garnered attention from policymakers in Washington, who want to ensure that the world builds AI systems using American, not Chinese, technology. US officials — and Huawei itself — estimate that the Ascend lineup trails Nvidia’s offerings by a generation or more.

Parties in the UAE — including the Mohamed bin Zayed University of Artificial Intelligence — haven’t shown interest, the people said, while the status of talks in Thailand is unclear. Representatives for the UAE government and the university didn’t respond to requests for comment, while Thai officials didn’t immediately respond on a public holiday.

Huawei has also pursued a deal for some 3,000 Ascend chips in Malaysia, Bloomberg News has reported, though the status of that project is unclear. Saudi Arabia, meanwhile, seems open to potential purchases — including by the Saudi Data & AI Authority or SDAIA, according to one person who described those conversations as advanced. The Saudi government didn’t immediately respond to a request for comment, while a SDAIA spokesperson said that “at this stage, we’re not in a position to provide a comment as the matter is outside our current scope.”

A senior Trump administration official has said Huawei can only make 200,000 AI chips this year, which are expected to be delivered mostly within China, where demand exceeds a million processors. (That number doesn’t include a stockpile of 2.9 million Ascend 910B dies Huawei managed to source from production powerhouse Taiwan Semiconductor Manufacturing Co.)

But Washington “shouldn’t take too much comfort in the fact that China’s production of these advanced chips is relatively small, because we know they have global ambitions,” Commerce Under Secretary Jeffrey Kessler told lawmakers last month.

Huawei declined to comment for this story, which is based on interviews with around a half-dozen people who requested anonymity to discuss sensitive information. The company said earlier this year it hasn’t shipped Ascend chips to Malaysia, and the Malaysian government has also distanced itself from that private project.

Previously, the Deputy Minister had announced “A phased rollout of 3,000 Ascend chips by 2026 will form the backbone of Malaysia’s national AI grid.” That’s not a lot of chips but it does show China’s intent to export the Huawei+DeepSeek stack. A harbinger of things to come.

US officials are particularly focused on AI infrastructure projects in the Middle East and Southeast Asia, given those regions’ technological ambitions as well as their longtime ties to Beijing — and Huawei. While many governments have sought to avoid picking sides in the US-China AI race, Washington has applied increasing pressure for those decisions by warning companies against using Huawei AI processors — while offering access to advanced American chips, but only under certain conditions.

Those conditions, though, have yet to be determined. Nearly two months after the Trump administration said it would overhaul a Biden-era framework, officials remain divided on the national security implications of Nvidia and AMD sales to places like the UAE and Saudi Arabia. The Commerce Department has drafted but not finalized a rule that would formalize its May announcement and extend license requirements on AI chips to Malaysia and Thailand — but which doesn’t constitute a comprehensive replacement to Biden’s approach.

The agency also hasn’t approved chip shipments for billions of dollars in AI deals touted as part of President Donald Trump’s May trip to the Persian Gulf, people familiar with the matter said. AI chip exports to the UAE, Saudi Arabia and other Gulf nations have required US licenses since 2023. Nvidia declined to comment. AMD and the Commerce Department didn’t respond to requests for comment.

For Trump officials who’ve argued in favor of those projects, Huawei’s attempts to export Ascend chips are all the more reason to move quickly — so that the company doesn’t lock in customers now and then ship larger volumes in the future, people familiar with the matter said. But others remain worried that sizable exports of US chips could ultimately benefit Beijing, and argue that Nvidia’s dominance gives Washington leverage to impose stronger security conditions on overseas data centers.

In these officials’ view, people familiar with the matter said, the fact that Huawei is only offering foreign customers a few thousand Ascend chips — and not even its best ones — illustrates exactly why the US can afford to take its time.

US asked, the government has long collaborated with Huawei on AI initiatives. But it remains unclear whether SDAIA would move forward with an Ascend 910B deal — or how the US could respond.

The Commerce Department earlier this year said use of Huawei’s Ascend chips “anywhere in the world” could be a violation of US trade restrictions, which the agency says cover those processors because Huawei uses American technology in its production process.

Amid backlash from Beijing, the Commerce Department removed that global reference, though the guidance still says that unapproved use of the Ascend 910B, 910C or 910D — a future Huawei model — may result in penalties from Washington.

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-07-08 08:22:03

Groq thách thức Nvidia: mở trung tâm dữ liệu AI đầu tiên tại châu Âu, tăng tốc “cuộc đua suy luận”

Groq – công ty khởi nghiệp bán dẫn AI của Mỹ – công bố mở trung tâm dữ liệu đầu tiên tại châu Âu, đặt tại Helsinki, Phần Lan, hợp tác cùng Equinix.
Mục tiêu là đáp ứng nhu cầu ngày càng tăng về dịch vụ AI tại châu Âu, trong bối cảnh nhiều công ty Mỹ (như Nvidia) đang đổ vốn vào khu vực này.
Phần Lan và khu vực Bắc Âu được ưu tiên do khí hậu mát mẻ và nguồn năng lượng tái tạo dồi dào, lý tưởng cho vận hành trung tâm dữ liệu.
Groq được định giá 2,8 tỷ USD, có các nhà đầu tư gồm Samsung và Cisco. Họ thiết kế chip “Language Processing Unit” (LPU), chuyên cho AI suy luận (inferencing).
Suy luận AI là giai đoạn mô hình đã huấn luyện xử lý dữ liệu đầu vào để tạo kết quả, khác với huấn luyện mô hình AI vốn dùng GPU như của Nvidia.
CEO Jonathan Ross cho biết Groq không dùng các thành phần đắt đỏ như bộ nhớ băng thông cao (HBM) – yếu tố khiến Nvidia bị phụ thuộc chuỗi cung ứng hạn chế.
Groq tập trung vào mảng suy luận với sản lượng cao nhưng biên lợi nhuận thấp – giúp giảm tải cho Nvidia vốn tập trung vào huấn luyện AI lợi nhuận cao.
Công ty chỉ mất 4 tuần để quyết định và triển khai trung tâm dữ liệu tại Phần Lan, dự kiến vận hành cuối tuần này – nhanh hơn so với thị trường.
Trung tâm dữ liệu đặt gần người dùng giúp tăng tốc độ dịch vụ và đáp ứng chính sách “AI có chủ quyền” của châu Âu – dữ liệu phải xử lý nội địa.
Groq đã có mặt tại Mỹ, Canada và Ả Rập Xê Út. Với Equinix – đơn vị kết nối các nhà cung cấp đám mây như AWS, Google Cloud – khách hàng có thể truy cập năng lực suy luận AI của Groq một cách linh hoạt.

📌 Groq mở trung tâm dữ liệu đầu tiên tại châu Âu (Helsinki), đẩy nhanh tham vọng cạnh tranh với Nvidia trong lĩnh vực AI suy luận. Với chip LPU không cần linh kiện đắt đỏ và thời gian triển khai chỉ 4 tuần, Groq nhắm tới thị trường sản lượng cao, biên lợi nhuận thấp, phục vụ tốt cho nhu cầu AI bản địa hóa của châu Âu.

https://www.cnbc.com/2025/07/07/ai-chip-startup-groq-expands-with-first-european-data-center.html

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-07-08 08:16:15

Phần Lan chính thức ủng hộ Nokia xây nhà máy AI gigafactory cho EU: Mục tiêu 200 tỷ euro

Chính phủ Phần Lan đã chính thức ủng hộ đề xuất của Nokia, dẫn đầu một liên minh doanh nghiệp, nhằm xây dựng một trong số 5 nhà máy AI gigafactory của EU tại nước này.
Đây là một phần của chương trình InvestAI do Ủy ban châu Âu khởi xướng, nhằm thu hút 200 tỷ euro đầu tư vào trí tuệ nhân tạo và siêu máy tính hiệu năng cao trên toàn khối.
Gigafactory AI dự kiến sẽ là trung tâm hạ tầng lớn phục vụ phát triển, huấn luyện và triển khai các mô hình AI tiên tiến với sự đầu tư tư nhân chiếm 65% tổng vốn, đồng thời chịu toàn bộ chi phí vận hành.
Phần Lan xem dự án là cơ hội để thúc đẩy tăng trưởng kinh tế bền vững, thu hút đầu tư và khẳng định vị thế công nghệ. Lợi thế bao gồm năng lượng sạch, quỹ đất rộng, và hệ sinh thái công nghệ với năng lực cao về dữ liệu, nghiên cứu, khởi nghiệp và công nghệ lượng tử.
Chính phủ cũng hy vọng gigafactory này sẽ có thể hợp tác với LUMI, một trong những siêu máy tính AI hàng đầu châu Âu, đã đặt tại Phần Lan.
Đề xuất của Nokia nằm trong số 76 hồ sơ từ khắp châu Âu, hiện vẫn đang được giữ bí mật. Dự kiến EU sẽ công bố thư mời chính thức vào cuối năm 2025.
Phần Lan tuyên bố mở cửa hợp tác khu vực, sẵn sàng phối hợp với các quốc gia Bắc Âu và Baltic để mở rộng phạm vi và sức mạnh công nghệ của dự án.
Chính phủ và các doanh nghiệp đang chuẩn bị bước vào vòng đàm phán tiếp theo với Ủy ban châu Âu và các ứng viên được chọn, với mục tiêu đưa nhà máy AI đầu tiên của EU đến Phần Lan.

📌 Chính phủ Phần Lan đã chính thức hậu thuẫn đề xuất của Nokia nhằm xây dựng AI gigafactory cho EU tại Espoo, trong khuôn khổ chương trình InvestAI trị giá 200 tỷ euro. Dự án hứa hẹn thúc đẩy tăng trưởng công nghệ, khai thác năng lượng sạch, và phối hợp với LUMI – siêu máy tính AI hàng đầu châu Âu. Phần Lan đang định vị mình là trung tâm phát triển AI bền vững tại châu Âu.

https://www.helsinkitimes.fi/finland/finland-news/domestic/27331-finland-backs-nokia-bid-to-host-eu-ai-gigafactory.html

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-07-04 12:47:37

Alibaba Cloud mở rộng tại APAC với DC mới tại Malaysia và Philippines, ra mắt Trung tâm Năng lực AI Toàn cầu tại Singapore

Alibaba Cloud kỷ niệm 10 năm hoạt động tại Singapore bằng việc công bố mở rộng quy mô với Trung tâm Năng lực AI Toàn cầu và hai trung tâm dữ liệu mới tại Đông Nam Á.
Trung tâm dữ liệu thứ ba tại Malaysia đã chính thức hoạt động vào ngày 1/7/2025; còn trung tâm thứ hai tại Philippines dự kiến khai trương vào tháng 10/2025.
Các trung tâm này nhằm đáp ứng nhu cầu ngày càng tăng về dịch vụ AI và điện toán đám mây trong khu vực, tiếp nối các khoản đầu tư trước đó tại Thái Lan, Mexico và Hàn Quốc.
Trung tâm AI toàn cầu tại Singapore đặt mục tiêu hỗ trợ 5.000 doanh nghiệp và 100.000 lập trình viên.
- Có phòng thí nghiệm AI Innovation Lab cung cấp token credit, bộ dữ liệu đặc thù và hỗ trợ triển khai.
- Sẽ cùng phát triển giải pháp với hơn 1.000 doanh nghiệp và ra mắt hơn 10 AI agent trong các lĩnh vực: tài chính, y tế, hậu cần, sản xuất, bán lẻ và năng lượng.
Alibaba Cloud cũng sẽ hợp tác với hơn 120 cơ sở đào tạo toàn cầu để đào tạo 100.000 chuyên gia AI mỗi năm nhằm giải quyết nhu cầu lớn về nhân lực chất lượng cao.
Singapore tiếp tục là trụ sở quốc tế và là nền tảng tăng trưởng trọng điểm của Alibaba tại khu vực châu Á – Thái Bình Dương.
Selina Yuan, Chủ tịch mảng Kinh doanh quốc tế của Alibaba Cloud, khẳng định cam kết của tập đoàn trong việc thúc đẩy đổi mới AI và chuyển đổi số bền vững tại Singapore và khu vực.

📌

Alibaba Cloud đánh dấu 10 năm tại Singapore bằng việc mở Trung tâm AI toàn cầu và thêm trung tâm dữ liệu tại Malaysia (1/7) và Philippines (10/2025). Họ sẽ hỗ trợ 100.000 lập trình viên, 5.000 doanh nghiệp, hợp tác với 120 tổ chức để đào tạo 100.000 chuyên gia AI mỗi năm. Singapore tiếp tục giữ vai trò trụ sở toàn cầu, là đầu tàu đổi mới AI và điện toán đám mây khu vực.

https://fintechnews.sg/113355/cloud/alibaba-cloud-singapore-ai-hub/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-07-04 12:42:53

Singapore phát hiện đường dây buôn lậu chip Nvidia sang Trung Quốc cho AI DeepSeek

Tòa án Singapore đã tạm hoãn phiên xét xử ba bị cáo bị cáo buộc buôn lậu chip AI Nvidia cho đến ngày 22/08/2025 để cơ quan công tố có thêm thời gian điều tra và chờ phản hồi từ các bên quốc tế liên quan.
3 bị cáo bao gồm 2 công dân Singapore, Woon Guo Jie (41 tuổi) và Alan Wei Zhaolun (49 tuổi), cùng công dân Trung Quốc Li Ming (51 tuổi), bị buộc tội gian lận và khai báo sai về điểm đến cuối cùng của các máy chủ và thiết bị công nghệ mua trong năm 2023 và 2024.
Vụ việc được phát hiện sau khi mô hình AI DeepSeek – một hệ thống ngôn ngữ lớn cạnh tranh với các mô hình AI của Mỹ – ra mắt cuối năm 2024. Cơ quan Mỹ nghi ngờ DeepSeek đã sử dụng GPU AI bị cấm, mua qua đường buôn lậu từ Singapore.
Theo Nvidia, Singapore chiếm tới 28% doanh thu toàn cầu trong khi chỉ nhận 1% số lô hàng – gây nghi ngờ về hành vi trung chuyển hàng hóa công nghệ cao ra khỏi Singapore đến các bên thứ ba.
Các phương pháp buôn lậu ngày càng tinh vi, từng có trường hợp chip bị giấu trong tôm hùm sống và bụng giả mang thai. Việc này khiến Quốc hội Mỹ xem xét luật bắt buộc gắn công nghệ theo dõi vào các GPU cao cấp.
Nvidia phủ nhận liên quan, CEO Jensen Huang tuyên bố “không có bằng chứng về việc chuyển hướng chip AI”, nhưng nhiều báo cáo thực tế lại cho thấy ngược lại.
Sự kiện này phản ánh lỗ hổng trong hệ thống giám sát chuỗi cung ứng và đặt ra thách thức lớn về quản lý xuất khẩu, nhất là tại các trung tâm kinh tế như Singapore – nơi hóa đơn có thể phát sinh nhưng hàng không thực sự lưu trú.

📌

Singapore đang điều tra 3 bị cáo buôn lậu GPU Nvidia sang Trung Quốc phục vụ mô hình AI DeepSeek. Dù chỉ chiếm 1% lượng hàng giao, Singapore lại đại diện tới 28% doanh thu Nvidia – dấu hiệu rõ của trung chuyển công nghệ. Vụ việc cho thấy lỗ hổng lớn trong kiểm soát xuất khẩu và thúc đẩy Mỹ đề xuất gắn công nghệ theo dõi lên GPU cao cấp. Vụ án sẽ tiếp tục vào tháng 8, thu hút sự quan tâm toàn cầu.

https://www.tomshardware.com/tech-industry/singapore-ai-chip-court-case-adjourned-until-august-trio-accused-of-illegally-smuggling-nvidia-chips-to-china-for-use-by-ai-firm-deepseek

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-07-04 09:48:41

Chỉ 32 quốc gia sở hữu trung tâm dữ liệu chuyên cho AI, tạo ra khoảng cách số toàn cầu sâu sắc

Một nghiên cứu của Đại học Oxford cho thấy chỉ 32 quốc gia – phần lớn ở Bắc bán cầu – hiện có trung tâm dữ liệu chuyên dụng cho AI, chiếm khoảng 16% tổng số quốc gia toàn cầu.
Mỹ, Trung Quốc và EU chiếm ưu thế tuyệt đối, sở hữu hơn 50% trung tâm dữ liệu AI lớn nhất thế giới, với Mỹ dẫn đầu 87 trung tâm, Trung Quốc 39 và châu Âu chỉ 6.
Trong khi đó, châu Phi và Nam Mỹ gần như trắng tay. Hơn 150 quốc gia không có một trung tâm tính toán AI nào, ảnh hưởng nghiêm trọng đến nghiên cứu, đổi mới và chủ quyền công nghệ.
Các hệ thống AI hàng đầu như ChatGPT chủ yếu huấn luyện bằng tiếng Anh và tiếng Trung, do phần lớn sức mạnh tính toán tập trung tại các quốc gia sử dụng hai ngôn ngữ này.
Các quốc gia thiếu trung tâm tính toán AI phải thuê dịch vụ từ các trung tâm ở Mỹ hoặc Trung Quốc, dẫn đến chi phí cao, tốc độ chậm, và phụ thuộc vào quy định nước ngoài.
Ví dụ, startup Qhala (Kenya) phải “tranh thủ làm việc sáng sớm” để giảm độ trễ khi gửi dữ liệu tới trung tâm dữ liệu ở nước ngoài.
GPU – bộ xử lý đồ họa từ Nvidia là thành phần cốt lõi trong trung tâm AI, nhưng việc sở hữu rất khó khăn do giá cao và nguồn cung hạn chế.
Dù các nước như Ấn Độ, Brazil và EU đang đầu tư mạnh cho hạ tầng AI nội địa, khoảng cách vẫn rất lớn. Brazil chi 4 tỷ USD, còn EU dự kiến đầu tư 200 tỷ euro.
Một trung tâm dữ liệu AI của Cassava (Zimbabwe) sắp đi vào hoạt động, với 500 triệu USD xây dựng 5 trung tâm khắp châu Phi, nhưng vẫn chỉ đáp ứng 10–20% nhu cầu khu vực.
Mỹ và Trung Quốc đang sử dụng công nghệ để gia tăng ảnh hưởng địa chính trị, kiểm soát chuỗi cung ứng AI thông qua lệnh cấm xuất khẩu chip hoặc cung cấp hỗ trợ tài chính đổi lấy quyền truy cập.
Ngay cả nước đồng minh của Mỹ như Kenya cũng bị loại khỏi danh sách quốc gia được tiếp cận GPU do hạn chế thương mại.
Trong cuộc đua này, nhiều sinh viên giỏi từ Argentina, châu Phi và các nước đang phát triển đã phải rời bỏ quê hương để tìm đến nơi có GPU và hạ tầng tốt hơn, gây ra tình trạng “chảy máu chất xám”.

📌 Khoảng cách AI toàn cầu ngày càng sâu sắc: chỉ 32 quốc gia sở hữu trung tâm tính toán AI, trong khi hơn 150 nước không có gì. Mỹ và Trung Quốc đang dẫn đầu, nắm tới 90% cơ sở hạ tầng AI toàn cầu, khiến nhiều nước rơi vào tình trạng lệ thuộc và bị bỏ lại phía sau trong kỷ nguyên công nghệ quyết định tương lai số.

https://www.nytimes.com/interactive/2025/06/23/technology/ai-computing-global-divide.html

Không có file đính kèm.

Nguồn tham khảo

AI mở-nguồn mở AI chips-hardware-compute 2025-07-02 01:14:55

Huawei chính thức mở nguồn 2 mô hình AI thuộc dòng Pangu cùng công nghệ suy luận

Ngày 1/7/2025, Huawei chính thức công bố mở nguồn hai mô hình AI thuộc dòng Pangu cùng công nghệ suy luận, nhằm tăng tốc xây dựng hệ sinh thái AI và mở rộng ra thị trường toàn cầu.
Động thái này được xem là chiến lược ứng phó với các lệnh hạn chế xuất khẩu chip AI từ Mỹ, đồng thời giúp Huawei củng cố hệ sinh thái phần cứng và phần mềm AI, theo nhận định của Paul Triolo, phó chủ tịch DGA-Albright Stonebridge Group.
Huawei định vị chiến lược dựa trên "Ascend ecosystem", tức hệ sinh thái xoay quanh dòng chip AI Ascend – đối thủ lớn nhất của Nvidia tại Trung Quốc trong bối cảnh Nvidia bị cấm bán sản phẩm cao cấp vào nước này.
Tương tự Google với Gemma, Huawei đang áp dụng chiến lược "chip-to-model": bán chip và phần cứng thông qua việc mở nguồn phần mềm AI.
Lian Jye Su, chuyên gia tại Omdia, cho biết mở nguồn mô hình Pangu giúp doanh nghiệp và nhà phát triển dễ dàng kiểm thử, tùy biến, từ đó thúc đẩy nhu cầu cho các sản phẩm khác của Huawei.
Không giống Baidu hay DeepSeek tập trung vào LLM đa năng, Huawei chọn hướng phát triển mô hình AI chuyên sâu theo ngành như chính phủ, tài chính và sản xuất.
Huawei mời cộng đồng quốc tế, bao gồm nhà nghiên cứu, doanh nghiệp và lập trình viên toàn cầu, sử dụng mô hình nguồn mở này để lấy phản hồi và cải thiện.
Marc Einstein, giám đốc nghiên cứu tại Counterpoint, nhận định chiến lược nguồn mở của Huawei sẽ rất phù hợp với các thị trường đang phát triển, nơi chi phí luôn là yếu tố then chốt.
Huawei cũng lên kế hoạch mang giải pháp trung tâm dữ liệu AI ra thị trường quốc tế, củng cố tham vọng mở rộng toàn cầu.

📌 Huawei chính thức mở nguồn mô hình AI Pangu và công nghệ suy luận để thúc đẩy hệ sinh thái chip Ascend, nhắm vào thị trường quốc tế, đặc biệt là các nước đang phát triển. Chiến lược "phần mềm mở, bán phần cứng" giúp Huawei đối đầu Nvidia và khẳng định vị thế AI toàn cầu.

https://www.cnbc.com/2025/07/01/huawei-open-sources-more-ai-models-grows-into-chinese-ai-juggernaut.html

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-07-01 01:08:50

EU nhận được 76 hồ sơ từ các công ty trong và ngoài khối để xây dựng 4 nhà máy AI gigafactory với ngân sách 20 tỷ euro

Liên minh châu Âu (EU) công bố đã nhận được 76 hồ sơ đề xuất xây dựng AI gigafactory, vượt xa kỳ vọng ban đầu.
Thông tin được bà Henna Virkkunen, Phó Chủ tịch Ủy ban Châu Âu phụ trách Chủ quyền công nghệ, An ninh và Dân chủ, đưa ra trong cuộc họp báo ngày 30/6/2025 tại Brussels.
Các đề xuất đến từ 16 quốc gia thành viên EU và trải dài trên 60 địa điểm khác nhau, cho thấy mức độ quan tâm cực lớn với kế hoạch AI của châu Âu.
Hồi đầu năm, EU đã công bố quỹ tài trợ trị giá 20 tỷ euro (tương đương 23 tỷ USD) để xây dựng 4 AI gigafactory, với mục tiêu thu hẹp khoảng cách công nghệ với Mỹ và Trung Quốc.
Mỗi AI gigafactory sẽ là trung tâm tính toán và lưu trữ dữ liệu AI quy mô lớn, được trang bị khoảng 100.000 chip AI thế hệ mới nhất.
Tổng hợp từ các đơn vị đăng ký, kế hoạch mua vào lên tới ít nhất 3 triệu GPU AI cao cấp, một con số ấn tượng cho thấy sự quyết liệt trong đầu tư hạ tầng AI.
Danh sách các công ty tham gia chưa được công bố vì lý do bảo mật, nhưng bao gồm cả doanh nghiệp trong EU và ngoài EU, trong đó có:
- Các gã khổng lồ công nghệ,
- Nhà vận hành trung tâm dữ liệu,
- Nhà cung cấp viễn thông,
- Công ty năng lượng,
- Các quỹ đầu tư tài chính.
Henna Virkkunen nhận định: "Phản hồi vượt xa mong đợi này thể hiện rõ đà phát triển mạnh mẽ của AI tại châu Âu."
EU dự kiến sẽ chính thức mở thầu chọn đối tác xây dựng AI gigafactory vào cuối năm 2025.
Động thái này được xem là nỗ lực chiến lược của EU nhằm đảm bảo chủ quyền công nghệ, giảm phụ thuộc vào các nền tảng AI của Mỹ và Trung Quốc.

📌 EU nhận được 76 đề xuất từ 16 quốc gia, trải rộng trên 60 địa điểm, để xây dựng 4 AI gigafactory với ngân sách 20 tỷ euro (~23 tỷ USD). Các công ty cam kết mua vào ít nhất 3 triệu GPU AI thế hệ mới, cho thấy tham vọng khổng lồ của châu Âu trong cuộc đua AI toàn cầu. Đợt mở thầu chính thức dự kiến diễn ra cuối năm 2025.

https://www.reuters.com/sustainability/boards-policy-regulation/europes-ai-gigafactory-push-attracts-76-bids-eu-tech-chief-says-2025-06-30/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-06-29 09:08:28

Vì sao Trung Quốc đang xây dựng trung tâm AI trên nóc nhà thế giới - Tây Tạng

Trung Quốc xây dựng trung tâm tính toán AI Yajiang-1 tại độ cao 3.600 mét ở Tây Tạng, thuộc kế hoạch "Dữ liệu phương Đông, tính toán phương Tây".
Mục tiêu chính: tận dụng khí hậu lạnh tự nhiên, oxy thấp giúp giảm chi phí làm mát và tiết kiệm năng lượng cho các tác vụ đào tạo AI khổng lồ.
Trung tâm sử dụng năng lượng tái tạo dồi dào tại Tây Tạng như điện mặt trời, thủy điện và gió kết hợp với hệ thống thu hồi nhiệt thải.
Giai đoạn đầu, Yajiang-1 triển khai hơn 256 máy chủ hiệu suất cao với tổng sức mạnh tính toán đạt 2.000 petaflop.
Hiệu suất sử dụng điện đạt chỉ số PUE dưới 1.3 – cao hơn 40% so với các trung tâm dữ liệu truyền thống.
Trung tâm tiết kiệm 320 triệu kWh điện mỗi năm, tương đương giảm 280.000 tấn khí thải CO2.
Hệ thống điện mặt trời 25.000 m² cung cấp 48 GWh điện sạch mỗi năm và chuyển nhiệt thải từ máy chủ thành năng lượng sưởi ấm, giúp giảm 12.000 tấn than tiêu thụ.
Yajiang-1 hỗ trợ các ứng dụng AI như lái xe tự hành, y tế thông minh, giám sát hệ sinh thái cao nguyên.
Đây là trung tâm AI đầu tiên của Trung Quốc trên cao nguyên Tây Tạng, mở rộng kế hoạch tính toán sang khu vực chưa từng có tiền lệ trong mạng lưới dữ liệu quốc gia.
Tuy nhiên, báo cáo của chính quyền địa phương cũng thừa nhận căng thẳng giữa bảo vệ môi trường và phát triển công nghệ.

📌 Trung tâm AI Yajiang-1 tại Tây Tạng giúp Trung Quốc tiết kiệm 320 triệu kWh điện và giảm 280.000 tấn CO2 mỗi năm nhờ khí hậu lạnh tự nhiên và điện sạch. Đây là bước đi chiến lược biến Tây Tạng thành trung tâm siêu máy tính xanh phục vụ đào tạo AI và phát triển kinh tế số vùng cao.

https://www.scmp.com/news/china/science/article/3316207/why-china-building-ai-centres-roof-world

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-06-28 10:53:59

Chủ quyền tính toán AI: Chỉ 24 quốc gia đủ năng lực huấn luyện AI, 9 quốc gia chạy suy luận AI

AI Compute Sovereignty (Chủ quyền tính toán AI) là khái niệm mô tả quyền kiểm soát hạ tầng điện toán AI, được phân thành 3 cấp độ chính:
(1) Vị trí trung tâm dữ liệu AI trên lãnh thổ quốc gia.
(2) Quốc tịch và quyền sở hữu của nhà cung cấp dịch vụ cloud.
(3) Quốc tịch nhà sản xuất chip AI (AI accelerator) — yếu tố then chốt nhất quyết định sức mạnh tính toán AI.
Báo cáo điều tra trên 9 nhà cung cấp cloud hàng đầu thế giới (AWS, Google, Microsoft – Mỹ; Alibaba, Huawei, Tencent – Trung Quốc; Exoscale, Hetzner, OVHCloud – Châu Âu) cho thấy:
- Có tổng cộng 225 cloud region trên toàn cầu.
- Chỉ 132 vùng có trang bị AI accelerator, tức chỉ khoảng 58,7% đáp ứng được yêu cầu cho AI.
- Các vùng này chỉ xuất hiện ở 33 quốc gia, nghĩa là 162 quốc gia còn lại không có bất kỳ trung tâm dữ liệu AI công khai nào trên lãnh thổ.
Chỉ 24 quốc gia sở hữu AI compute đủ mạnh để huấn luyện mô hình AI tiên tiến (training-relevant), bao gồm Mỹ, Trung Quốc, Đức, Nhật, Hàn Quốc, Pháp, Anh, Ấn Độ, Israel, UAE…
- 9 quốc gia còn lại chỉ có khả năng chạy suy luận AI (inferencing) như Bahrain, Chile, Indonesia, Malaysia, Đài Loan, Thái Lan, Saudi Arabia…
- Mỹ dẫn đầu với 26 cloud region, trong đó 22 region có chip đủ mạnh cho huấn luyện AI. Trung Quốc đứng thứ hai với 22 region, nhưng chỉ 4 region có chip huấn luyện còn lại chủ yếu là chip suy luận.
Xét theo quốc tịch nhà cung cấp cloud, chỉ Mỹ, Trung Quốc và một phần châu Âu đạt được chủ quyền tính toán ở cấp độ này.
- Các nước như Pháp, Đức, Singapore áp dụng chiến lược “hedging”: kết hợp cả cloud Mỹ và Trung Quốc để tránh phụ thuộc.
- Ngược lại, các nước như Úc, Nhật Bản, Israel chọn “aligning” với hạ tầng Mỹ. Trong khi đó, Chile, Indonesia, Saudi Arabia chọn Trung Quốc làm đối tác cloud duy nhất.
Ở cấp độ sâu hơn là chủ quyền chip AI, tình hình càng nghiêm trọng:
- 95,5% các trung tâm dữ liệu AI trên toàn thế giới đang phụ thuộc vào chip của Mỹ, đặc biệt là NVIDIA.
- NVIDIA hiện chiếm 80-95% thị phần chip AI toàn cầu, cung cấp cho hầu hết các cloud provider lớn như AWS, Google, Microsoft.
- Trung Quốc đang cố gắng phát triển chip nội địa như Huawei Ascend, SMIC 7nm, nhưng hiện chỉ xuất hiện giới hạn tại 3 region nội địa và 3 region ở Pháp, Singapore, UAE.
- Các quốc gia còn lại hoàn toàn phụ thuộc vào chuỗi cung ứng chip do Mỹ kiểm soát.
Chuỗi cung ứng AI accelerator toàn cầu hiện cực kỳ tập trung:
- Thiết kế chip: Chủ yếu do Mỹ (NVIDIA, Intel, AMD).
- Gia công: 90% thực hiện tại TSMC (Đài Loan).
- Thiết bị quang khắc: Gần như độc quyền bởi ASML (Hà Lan).
- Điều này dẫn đến rủi ro nghiêm trọng về gián đoạn chuỗi cung ứng, đặc biệt trong bối cảnh căng thẳng địa chính trị Mỹ-Trung và vấn đề Đài Loan.
Các quốc gia đang chạy đua để giành lại chủ quyền tính toán:
- Mỹ: Đầu tư 80 tỷ USD chỉ trong năm 2025 cho trung tâm dữ liệu AI và thúc đẩy CHIPS Act trị giá 39 tỷ USD.
- Châu Âu: Thông qua EU Chips Act trị giá 43 tỷ EUR (~46 tỷ USD) nhằm xây dựng ngành bán dẫn độc lập.
- Canada và Anh: Đưa ra chiến lược Compute Sovereignty với các khoản đầu tư công khổng lồ vào siêu máy tính và trung tâm dữ liệu AI.
Tuy nhiên, theo báo cáo, việc xây dựng chủ quyền tính toán không đơn giản:
- Chi phí xây dựng trung tâm dữ liệu AI rất lớn nhưng số việc làm tạo ra lại thấp.
- Trung tâm dữ liệu tiêu thụ lượng điện khổng lồ, gây áp lực lên lưới điện quốc gia và giá năng lượng. Ví dụ, một data center AI tiêu thụ điện tương đương hàng chục ngàn hộ gia đình.
- Ngoài điện, nước làm mát và đất đai cũng là yếu tố gây tranh cãi khi một số địa phương phản đối các dự án data center do nguy cơ cạn kiệt tài nguyên và phá vỡ hệ sinh thái.
Các mô hình hợp tác khu vực như EuroHPC (Châu Âu) đang được xem như giải pháp để chia sẻ tài nguyên tính toán mà không cần mỗi quốc gia đều phải đầu tư riêng.
Báo cáo nhấn mạnh rằng “Compute Sovereignty” không phải là lựa chọn trắng đen, mà là phổ chiến lược, từ phụ thuộc hoàn toàn, đa dạng hóa nhà cung cấp (hedging) đến tự chủ tuyệt đối (sovereignty).

📌 Thế giới AI đầy bất cân xứng: Chỉ 24 quốc gia có khả năng huấn luyện AI tiên tiến, còn lại phần lớn “lép vế”. 95,5% sức mạnh tính toán AI toàn cầu nằm trong tay Mỹ, chủ yếu nhờ NVIDIA. Trung Quốc đang cố gắng bứt phá với Huawei Ascend nhưng vẫn chịu rào cản từ chính sách kiểm soát xuất khẩu Mỹ. Cuộc chạy đua giành chủ quyền tính toán AI đang trở thành cuộc chạy đua vũ trang thế kỷ 21 với quy mô đầu tư vượt 250 tỷ USD vào năm 2027, đặt ra những bài toán lớn về an ninh quốc gia, chủ quyền dữ liệu và môi trường.

https://papers.ssrn.com/sol3/papers.cfm?abstract_id=5312977

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-06-27 07:14:12

Trung Quốc tăng giá linh kiện drone do kiểm soát xuất khẩu, Nhật Bản lặng lẽ sở hữu “ông vua AI ẩn danh” Nittobo

Sau vụ Mỹ tấn công ba cơ sở hạt nhân tại Iran, cuộc chiến 12 ngày giữa Israel và Iran chấm dứt với lệnh ngừng bắn, nhưng đã làm gia tăng lo ngại về an ninh toàn cầu, đặc biệt là an ninh kinh tế.
Hội thảo tại Đại học Tokyo ngày 20/6 nhấn mạnh tầm quan trọng của chuỗi cung ứng khoáng sản quan trọng, với chuyên gia Rand chỉ ra rằng bất kỳ mắt xích nào thiếu hụt đều khiến chuỗi cung ứng sụp đổ.
Ngành công nghiệp ô tô Mỹ và Nhật đã phải dừng dây chuyền do hạn chế xuất khẩu đất hiếm từ Trung Quốc.
Trung Quốc áp dụng quy định xuất khẩu hàng lưỡng dụng từ tháng 9/2024, khiến giá linh kiện drone tăng gấp 3,5 lần tại Mỹ. Lượng xuất khẩu camera hồng ngoại giảm 60%, nhưng giá trị xuất khẩu tăng 50%.
Trung Quốc chiếm 90% thị phần drone thương mại tại Mỹ, theo báo cáo năm 2024 của Marco Rubio (nay là Ngoại trưởng Mỹ).
Nhật Bản sở hữu "ông vua AI ẩn danh" Nittobo – công ty duy nhất trên thế giới sản xuất vải thủy tinh cao cấp cho máy chủ AI. Nvidia, AMD và Microsoft đều phải đến tận nơi tại Nhật để đảm bảo nguồn cung.
Nittobo vốn là công ty kéo sợi bông trước Thế chiến II, sau đó chuyển mình thành nhà sản xuất vật liệu công nghệ cao phục vụ ngành AI.
Trung Quốc đặt cược vào nền kinh tế tầm thấp (low-altitude economy) với mục tiêu thị trường đạt 3.5 nghìn tỷ NDT (khoảng 482 tỷ USD) vào năm 2035, với drone phục vụ giao hàng, nông nghiệp và quản lý đô thị.
Công ty Melexis (Bỉ) đặt nhà máy tại Malaysia để trung lập hóa rủi ro thương mại, xuất khẩu cho cả Mỹ và Trung Quốc. ASML hợp tác với Carl Zeiss phát triển thế hệ máy in thạch bản phục vụ sản xuất chip từ năm 2035 trở đi.

📌 Giá drone tăng gấp 3,5 lần do Trung Quốc siết xuất khẩu, Mỹ mất 90% nguồn cung drone thương mại. Nhật Bản lộ diện “ông vua AI” Nittobo – nhà cung cấp vật liệu sống còn cho máy chủ AI toàn cầu. Nền kinh tế tầm thấp của Trung Quốc nhắm tới 482 tỷ USD vào năm 2035, khi căng thẳng chuỗi cung ứng ngày càng leo thang.

https://www.ft.com/content/6f055dfb-97fa-4cdd-b75a-e104e3a9f20d

#FT

High-priced drones and Japan’s hidden AI champion

The inside story on the Asia tech trends that matter, from Nikkei Asia and the Financial Times

Kenjie Kawase, Itsuro Fujino, Lauly Li, Cheng Ting-Fang, Ryohtaroh Satoh, William Langley and Norman Goh

Since Donald Trump began his second term as US president in January, most of us living in this part of the world have probably got into the habit of checking first thing in the morning what he said, wrote or did while Asia was sleeping. This may have already led some of us to develop a sort of immunity to being shocked by his words and actions.

But the surprise attack against three nuclear sites in Iran by the US on Sunday morning surely came as a rude awakening for a lot of people, as it clearly escalated the war between Israel and Iran, deepening the crisis in the Middle East — and potentially for the entire world.

While a ceasefire was proclaimed by Trump and later confirmed by Iran and Israel, the “12-day war”, as it’s being called, has only underscored the need to enhance security, including on the economic front.

A number of forums and symposia discussing economic security have been held here recently, reflecting a rising sense of urgency among politicians, bureaucrats, academics and business leaders.

One of these was on June 20, hosted by the University of Tokyo with experts from Rand. The forum focused on securing a critical mineral supply chain, under the premise of a trilateral alliance between Japan, South Korea and the US Fabian Villalobos, senior engineer and professor of policy analysis from the American non-profit research institute, said critical minerals — including rare earths predominantly controlled by China — form the “bedrock of the value chain” for both civilian and military applications.

He said he is often asked, “What is the most important mineral?” But to him, that’s the “wrong question to ask”, because if any piece of the supply chain goes missing, the entire system becomes dysfunctional.

We’ve recently seen this in the auto industry, where American and Japanese makers were forced to halt production lines as China’s curbs on rare earth exports kicked in. This is not the first time China’s export restrictions have caused disruptions in global supply chains, either.

Potential bottlenecks of a different nature, meanwhile, may emerge from an entirely different source: the fact that vital tech components and materials are controlled by a small number of lesser-known companies in Japan.

Drone-flation

Chinese government regulations adopted in September requiring export permits for dual-use goods have more than tripled the price of drone components shipped to the US, according to a report by Nikkei’s Itsuro Fujino.

The analysis of Chinese customs data shows that the overall export volume of infrared devices, a key drone part enabling visibility in the dark, fell roughly 30 per cent between last September and April, while the export value rose nearly 50 per cent. The price per unit doubled during this period, stemming mainly from a tightened supply-demand balance. Exports to the US, which is the largest destination, dropped roughly 60 per cent by volume while the unit price jumped 3.5 times.

“Today, China has captured 90% of the U.S. market for commercial drones.” This statement comes from a 2024 report from the office of then-senator Marco Rubio, now the secretary of state, on the Chinese manufacturing sector. Rubio is surely well aware that Beijing could use drones as effective leverage in trade negotiations.

Essential threads

Column chart of ￥bn showing Nittobo is riding the AI boom

Nitto Boseki, or Nittobo, for short, may not be a household name, despite having a history that stretches back more than a century. But its products are so crucial for the AI supply chain that executives from Nvidia, AMD and Microsoft have been coming to Japan to pay it a visit.

In a collaborative work by Nikkei Asia’s Lauly Li and Cheng Ting-Fang in Taipei and Ryohtaroh Satoh in Tokyo, they explain how this relatively little-known AI-enabler is currently the only company in the world able to provide the highest-end glass cloth, a material essential for making high-powered AI servers.

Japan boasts several examples of seemingly obscure material makers that underpin the global tech supply chain. Nittobo, however, has a particularly interesting history. It was one of the “top 10 cotton-spinners” in Japan before second world war and helped lead the country’s economic reconstruction in the postwar era. As competition from other Asian economies pushed the entire industry to the corner, Nittobo became one of the most successful examples of a company transforming itself away from a sunset industry, while many of its peers perished. The boseki in its name, meaning cotton-spinning, is a reminder of that history of adaptation.

Low altitude, lofty ambitions

China is betting on its army of civilian drones to help it drive new sources of growth, writes the Financial Times’ William Langley.

The country dominates the production of commercial drones, accounting for 70-80 per cent of global supply, according to analytics provider Drone Industry Insights.

There were about 2.2mn drones registered with the Civil Aviation Administration of China by the end of last year, deployed to do everything from controlling crowds to fighting fires.

But Beijing’s ambitions go much further than that. The CAAC expects the market size of the low-altitude economy — which refers to airborne activities occurring less than 1,000 metres above ground — to grow fivefold to Rmb3.5tn by 2035.

That means finding new uses of the technology from private companies. The logistics and food delivery sectors are early adopters, with Meituan and its rivals already employing unmanned aircraft on some routes.

The country’s farms are also big users. About a third of industrial drones are also used in agriculture or forestry, according to 2022 figures from the Guanyan Tianxia Data Center.

But some in the highly competitive UAV industry say that it will be difficult to replace the buying power of big government and military buyers, while strict export controls have limited their potential reach overseas.

Double talk

Executives of two European tech companies recently sat down with Nikkei Asia to discuss their respective strategies.

Marc Biron, chief executive at Belgian chipmaker Melexis, explained how his company is leveraging its production capacity in “neutral” Malaysia to navigate geopolitical headwinds.

Speaking to Norman Goh in Kuala Lumpur, Biron said his company’s facility in Kuching, Sarawak, has been shipping chips to both the US and China as a “deliberate hedge” against mounting global trade fragmentation.

Biron is counting on Malaysia’s neutrality which he likens to Switzerland. “That neutrality allows us to manufacture for Asia, China and the US, from a single base.”

Meanwhile, Cheng Ting-Fang spoke with Jos Benschop, executive vice-president of technology at ASML, on the development of the next generation of cutting-edge lithography machines that would be advanced enough to serve the chip industry’s needs from 2035 and beyond.

The world’s largest semiconductor equipment maker is partnering with Carl Zeiss for this farsighted development push.

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute AI market 2025-06-25 08:38:42

Khoảng cách AI toàn cầu ngày càng khủng khiếp: Mỹ, Trung, EU dẫn đầu, 150 quốc gia bị bỏ lại

AI tạo ra một khoảng cách kỹ thuật số mới giữa các quốc gia có và không có sức mạnh tính toán (compute power), ảnh hưởng lớn đến địa chính trị và kinh tế toàn cầu.
Mỹ, Trung Quốc và EU chiếm hơn 50% số trung tâm dữ liệu AI mạnh nhất thế giới. Mỹ dẫn đầu với 87 trung tâm, Trung Quốc 39 và EU chỉ 6.
Chỉ 32 quốc gia (16% toàn cầu) sở hữu trung tâm dữ liệu AI quy mô lớn. Hơn 150 quốc gia không có bất kỳ trung tâm nào.
90% các trung tâm dữ liệu AI toàn cầu được điều hành bởi công ty Mỹ và Trung Quốc.
Các trung tâm dữ liệu hiện đại cực kỳ tốn kém, tiêu thụ lượng lớn điện và nước, với chi phí lên tới hàng chục tỷ USD. Ví dụ, dự án của OpenAI ở Texas trị giá 60 tỷ USD, rộng hơn cả Công viên Trung tâm New York.
Những quốc gia không có sức mạnh tính toán gặp khó khăn trong nghiên cứu khoa học, phát triển AI nội địa và giữ chân nhân tài. Nhiều startup ở châu Phi và Nam Mỹ phải thuê dịch vụ điện toán từ xa với chi phí cao, tốc độ chậm và phụ thuộc vào luật pháp nước ngoài.
Ví dụ: startup Qhala (Kenya) xây dựng mô hình ngôn ngữ cho tiếng châu Phi nhưng phải làm việc ban đêm để tranh thủ băng thông ít tắc nghẽn khi thuê server ở Mỹ.
Sự thống trị của Mỹ và Trung Quốc khiến các quốc gia khác buộc phải lựa chọn phụ thuộc vào một trong hai. Mỹ dùng chính sách hạn chế xuất khẩu chip AI để kiểm soát quyền truy cập, trong khi Trung Quốc cung cấp tài chính và thiết bị để mở rộng ảnh hưởng.
Nhu cầu về chip GPU (chủ yếu do Nvidia sản xuất) khiến giá tăng cao, và nguồn cung khan hiếm.
Các quốc gia như Ấn Độ, Brazil và Liên minh châu Âu đang đầu tư mạnh để xây dựng chủ quyền AI. EU lên kế hoạch chi 200 tỷ euro, Brazil đầu tư 4 tỷ USD.
Ở châu Phi, Cassava – công ty của tỷ phú Zimbabwe Strive Masiyiwa – đang xây dựng 5 trung tâm dữ liệu với chi phí 500 triệu USD. Tuy nhiên, dự kiến chỉ đáp ứng được 10%-20% nhu cầu AI của khu vực.
Harvard’s Kempner Institute (Mỹ) có sức mạnh tính toán lớn hơn toàn bộ châu Phi cộng lại.
Chính phủ nhiều quốc gia thừa nhận nếu không nhanh chóng xây dựng hạ tầng AI nội địa, họ sẽ mất chủ quyền kỹ thuật số vào tay các tập đoàn nước ngoài.
Hardy Pemhiwa, CEO Cassava, khẳng định: “Châu Phi không thể phó mặc chủ quyền AI cho người khác. Chúng tôi buộc phải hành động để không bị bỏ lại.”

📌 Khoảng cách AI toàn cầu ngày càng sâu sắc: Mỹ có 87 trung tâm AI, Trung Quốc 39, EU 6, trong khi hơn 150 quốc gia hoàn toàn không có. Châu Phi, Nam Mỹ và phần lớn thế giới đối mặt nguy cơ bị loại khỏi cuộc đua AI, dẫn đến mất chủ quyền số, tụt hậu kinh tế và phụ thuộc công nghệ. Cuộc đua xây dựng "AI chủ quyền" đang nóng hơn bao giờ hết.

https://www.business-standard.com/world-news/global-ai-gap-widens-as-compute-power-divides-nations-economies-125062300855_1.html

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-06-23 23:40:41

Mạng mới có thể tăng tốc AI gấp 6 lần: Cornelis thách thức Ethernet và InfiniBand

Cornelis Networks ra mắt kiến trúc mạng CN500, hướng tới khả năng tăng tốc hiệu suất AI gấp 6 lần so với các giao thức dựa trên Ethernet, hỗ trợ tới 500.000 máy chủ hoặc bộ xử lý mà không làm tăng độ trễ.
CN500 là công nghệ mạng thứ ba cạnh tranh trực tiếp với Ethernet và InfiniBand, được tối ưu cho máy tính hiệu suất cao (HPC) và ứng dụng AI hiện đại.
Trong lĩnh vực HPC, CN500 vượt mặt InfiniBand NDR (2022) với số lượng thông điệp gửi mỗi giây gấp đôi và độ trễ giảm 35%.
Khác với tư duy truyền thống là chia sẻ tài nguyên trên một máy chủ, Cornelis tập trung tối đa hóa số lượng bộ xử lý cho một ứng dụng duy nhất, tối ưu hóa việc huấn luyện mô hình AI.
Kiến trúc Omni-Path – ban đầu do Intel phát triển – đảm bảo thông lượng tối đa, không mất gói dữ liệu, phù hợp với mô hình mô phỏng khí hậu hoặc thiết kế thuốc.
Cornelis áp dụng thuật toán định tuyến thích ứng động để tránh tắc nghẽn và kiến trúc kiểm soát tắc nghẽn định hướng lưu lượng ra khỏi “điểm nóng”.
Giải pháp kiểm soát luồng dựa trên tín dụng cho phép cấp phát bộ nhớ trước khi gửi, tránh tình trạng quá tải phản hồi, giúp mạng không cần bộ đệm lớn và khó mở rộng.
Hệ thống vẫn tiếp tục hoạt động ngay cả khi GPU hoặc liên kết bị hỏng mà không cần khôi phục checkpoint, giảm thiểu thời gian chết và tiết kiệm tài nguyên.
CN500 là thẻ mạng gắn vào từng máy chủ, kết nối qua các switch cấp rack và switch trung tâm với tối đa 576 cổng.
Cornelis hiện hợp tác với 3 OEM để cung cấp card và switch tích hợp sẵn vào server, nhắm đến thị trường cần nâng cấp hạ tầng AI và mô phỏng HPC tốc độ cao.

📌 Cornelis Networks đang cách mạng hóa hạ tầng mạng AI với CN500, tăng hiệu suất truyền thông lên gấp 6 lần so với Ethernet, giảm 35% độ trễ so với InfiniBand. Công nghệ này hỗ trợ tới 500.000 bộ xử lý, không mất dữ liệu và giữ hệ thống hoạt động ngay cả khi có lỗi phần cứng – giải pháp lý tưởng cho kỷ nguyên AI đòi hỏi hiệu quả cao.

https://spectrum.ieee.org/ai-network-architecture

Không có file đính kèm.

Nguồn tham khảo

STI AI chips-hardware-compute 2025-06-23 06:57:55

Huawei vượt qua lệnh trừng phạt của Mỹ bằng chiến lược sản xuất 700.000 chip AI

Huawei đã vươn lên mạnh mẽ sau lệnh trừng phạt của Mỹ năm 2019, với dự kiến xuất xưởng 700.000 bộ xử lý AI Ascend trong năm 2025 (theo Mizuho), gồm các dòng 910A, 910B và 910C.
Dòng chip Ascend 910C mới có kiến trúc hai khuôn (dual-die), kết nối tốc độ cao, bộ nhớ tích hợp 8 tầng – hỗ trợ xử lý AI hiệu quả hơn đáng kể.
Huawei phát triển hệ thống CloudMatrix384 dùng 384 chip Ascend và 192 CPU Kunpeng, có khả năng xử lý 1.943 tokens/giây mỗi NPU và thời gian phản hồi dưới 50 mili giây/tokens trong giai đoạn giải mã AI.
CloudMatrix vượt qua framework phục vụ LLM của Nvidia là SGLang trong thử nghiệm mô hình DeepSeek R1 – cho thấy Huawei đang dẫn đầu về quy mô triển khai AI lớn.
Báo cáo từ SemiAnalysis cho rằng tuy chip Huawei tụt hậu một thế hệ so với Mỹ, nhưng hệ thống tổng thể lại vượt trước Nvidia và AMD về thiết kế và hiệu năng cụm.
Nvidia đã chịu tổn thất 4,5 tỷ USD vì chip H20 bị hạn chế xuất sang Trung Quốc, dự kiến mất thêm 8 tỷ USD doanh thu trong quý tới.
Các công ty AI lớn như iFlytek và SenseTime đã chuyển sang dùng chip nội địa như Ascend để tránh rủi ro từ lệnh cấm.
Huawei nhận được hỗ trợ từ chuỗi cung ứng nội địa, trong đó SiCarrier trình làng thiết bị sản xuất chip mới tại Semicon China 2025.
Trong khi Mỹ hạn chế phần mềm thiết kế EDA, các công ty Trung Quốc như Empyrean, Primarius và Semitronix đang nổi lên với khả năng cung cấp 80% công cụ EDA nội địa.
Ren Zhengfei, CEO Huawei, khẳng định không lo lắng về khó khăn từ lệnh cấm và tập trung vào tiến từng bước trong chiến lược tự chủ công nghệ.
Huawei được cho là đã xây dựng một hệ sinh thái phần cứng AI quy mô lớn, dẫn đầu nỗ lực tự lực về bán dẫn tại Trung Quốc.

📌 Huawei bất chấp lệnh cấm Mỹ, kỳ vọng xuất xưởng 700.000 chip AI Ascend trong năm 2025 với hệ thống CloudMatrix vượt hiệu suất của Nvidia tại Trung Quốc. Hệ thống dùng chip 910C xử lý 1.943 tokens/giây, dưới 50 mili giây/tokens. Huawei hiện đóng vai trò then chốt trong chiến lược AI và tự chủ bán dẫn quốc gia, với hệ sinh thái phần cứng đang phát triển mạnh.

https://www.scmp.com/tech/big-tech/article/3315239/how-huaweis-silicon-strategy-defies-us-sanctions-advance-chinas-ai-ambitions

How Huawei’s silicon strategy defies US sanctions to advance China’s AI ambitions

Huawei is expected to ship about 700,000 Ascend AI processors in 2025, according to Mizuho estimates

Ann Caoin ShanghaiandWency Chenin Shanghai

Published: 12:00pm, 21 Jun 2025

About three months after Huawei Technologies was added to Washington’s trade blacklist in 2019, the company’s then-rotating chairman, Eric Xu Zhijun, unveiled what he proclaimed as the “world’s most powerful AI processor” – the Ascend 910 – designed for training artificial intelligence (AI) models.

Huawei’s advanced AI chip initiative, however, suddenly faced a major obstacle a year later in August 2020, when the US Commerce Department tightened restrictions by barring the sale of semiconductor products and services – sourced from anywhere with US technology – to the company and its affiliates without a requisite licence.

As a result, Huawei supplier Taiwan Semiconductor Manufacturing Co, the world’s largest and most advanced contract chipmaker, ceased doing business with the Chinese firm and its integrated circuit (IC) design unit HiSilicon to comply with US curbs.

At the time, the prognosis appeared dire for Huawei, according to some analysts. “If enough companies comply globally, Huawei’s ability to generate workarounds will be severely undercut, putting its continued existence as a viable commercial entity in doubt,” said Paul Trolio of New York-based political risk consultancy Eurasia Group.

Fast-forward to 2025, and Huawei has remained resilient in the face of US sanctions.

Jensen Huang, founder and CEO of AI chip giant Nvidia, has been the most prominent industry leader to recognise the resurgence of Huawei in the IC sector.

“All in all, the export controls were a failure. The facts would suggest it,” Huang told reporters on the sidelines of last month’s Computex expo in Taipei. He called on the White House to lower barriers to AI chip sales before American firms cede the China market to rivals like Huawei.

Huang’s assessment followed Nvidia’s disclosure in April that the US government now required a licence to export its H20 chips to China. The company incurred a US$4.5 billion charge in its first quarter ended April 27, owing to excess inventory and purchase obligations for H20.

For the second quarter, Nvidia expects a US$8 billion revenue loss from the H20 chips ban. The H20 graphics processing unit (GPU) was designed for the China market after earlier US export controls.

The performance of Ascend chips against Nvidia’s in-demand GPUs was put under the spotlight this week, following the release of a technical paper that was jointly written by researchers from Huawei and Chinese AI infrastructure start-up SiliconFlow.

According to the paper, Huawei’s Ascend-powered advanced data centre architecture – CloudMatrix 384, along with the serving solution CloudMatrix-Infer – outperformed the Nvidia GPU-based SGLang fast-serving framework for large language models (LLMs), on both the inference and decoding phases, in running DeepSeek’s R1 reasoning model.

The CloudMatrix system, which the paper projected to “reshape the foundation of AI infrastructure”, consisted of 384 Ascend 910C neural processing units (NPUs) and 192 Kunpeng server central processing units, interconnected through a unified bus providing ultra-high bandwidth and low latency.

The highly efficient architecture reflects Huawei’s commitment to overcoming US tech restrictions, as the company pushes the boundaries of AI system performance.

According to an earlier assessment by SemiAnalysis, Huawei’s CloudMatrix directly competes with Nvidia’s GB200 NVL72 rack-scale system in alleviating bottlenecks for data centres.

In the decode phase of generating output from an AI model, the Huawei-SiliconFlow paper’s findings showed that CloudMatrix recorded 1,943 tokens per second per NPU for a 4,000-length key-value cache – a memory structure that enables more efficient use of AI processors.

The same phase showed output generation times consistently below 50 milliseconds per token, yielding an efficiency of 1.29 tokens per second per trillion floating-point operations per second.

“These results collectively establish CloudMatrix384, in combination with our peer-to-peer serving solution CloudMatrix-Infer, as a scalable, high-throughput and production-grade platform for large-scale LLM deployment,” the paper said.

It also provided details of Huawei’s 910C AI processor for the first time. The chip has a dual-die architecture, integrating two identical computing dies in a single package. These dies share eight stacks of on-package memory and communicate via a high-bandwidth connection fabric, which enables rapid data transfer that is crucial for intensive AI workloads.

“Huawei is a generation behind in chips, but its scale-up solution is arguably a generation ahead of Nvidia and AMD’s [Advanced Micro Devices] current products on the market,” the SemiAnalysis report said.

That echoed remarks made by Huawei founder and CEO Ren Zhengfei in a recent front-page interview published by the People’s Daily, the official mouthpiece of the Communist Party. Ren acknowledged that the Shenzhen-based firm’s Ascend chips still lagged behind those of US competitors by “a generation”.

He added, however, that using methods such as “stacking and clustering” resulted in computing performance comparable to the most advanced systems in the world.

“A single chip’s performance is not as important as the combined power of a group of chips working together in parallel,” said tech investor Kevin Xu, the founder and chief information officer of Interconnected Capital.

He pointed out that building large-scale systems requires networking expertise – a proficiency of Huawei, which remains the world’s largest vendor of telecommunications equipment.

“US export control has worked in slowing AI development progress in China, but it has also accelerated China’s push to indigenise every step of advanced AI chipmaking,” Xu said. Nvidia is no longer a reliable source of AI chips to the mainland, even if the company is allowed to sell in the market again, he added.

Meanwhile, the Trump administration’s cryptocurrency and AI tsar David Sacks warned that China had grown adept at evading US export controls and was, at most, two years behind American semiconductor design capabilities, according to a Bloomberg report on Friday.

He pointed out that DeepSeek’s breakthrough AI models earlier this year showed how China could still advance even with export controls in place.

Sacks said tight US restrictions on sales of AI chips to American allies – based on the Biden-era “AI Diffusion” rule, which the Trump administration has rescinded – could have unwittingly created an opening globally for Huawei and other Chinese companies.

“If we are too restrictive in terms of US sales to the world, I think that there will be a time when we kick ourselves and say, ‘All of a sudden Huawei is everywhere when we used to have the market to ourselves. Why didn’t we take advantage of that and lock it in?’” he said.

Those remarks echo comments made by Nvidia’s Huang on the sidelines of last week’s VivaTech conference in Paris, where he warned that Huawei was in a position to expand its semiconductor business should US chip export curbs stay in place.

“If the United States doesn’t want to participate in China, Huawei has got China covered,” Huang said. “Huawei [also] has got everybody else covered.”

Still, Huawei was expected to ship no more than 200,000 of its advanced AI processors this year, US Under Secretary of Commerce for Industry and Security Jeffrey Kessler told a congressional hearing last week. He estimated that “most or all of” those chips would be supplied to enterprises within China.

That figure would pale in comparison to the more than 1 million China-specific H20 GPUs produced by Nvidia in the last nine months of 2024, according to a January report from US research firm SemiAnalysis.

Estimates by analysts from Mizuho Securities, however, found Huawei could ship more than the number Kessler told US lawmakers.

About 700,000 units of Huawei’s Ascend 910 series – including the 910A, 910B and 910C – were expected to ship in 2025, despite yield challenges faced by the mainland’s biggest contract chipmaker, Semiconductor Manufacturing International Corp, at the 7-nanometre (nm) node, according to Mizuho.

An aerial view of the factory of Shanghai-based Semiconductor Manufacturing International Corp in Shenzhen, southern Guangdong province. Photo: VCG via Getty Images.

Speculation on how Huawei has managed to pull off increased production of Ascend chips has pointed to the mobilisation of China’s chip equipment supply chain.

SiCarrier, a Chinese semiconductor equipment maker with ties to Huawei, gained wide acclaim for its first public display of dozens of new chip manufacturing and testing machines at Semicon China in March. That raised conjecture about SiCarrier’s possible contribution to the local development of Huawei’s 7-nm chip, initially used in the Mate 60 Pro 5G handset released in 2023.

A steady output of Ascend chips would augur well for Chinese AI companies, such as iFlytek and SenseTime, that have already shifted to buying locally made chips.

Liu Qingfeng, founder and chairman of voice-recognition specialist iFlytek, said earlier this month that his firm used domestic chips, such as Huawei’s Ascend 910B, even though that could delay AI model development by three months. The company has been barred from buying advanced US chips since it was added to Washington’s trade blacklist in October 2019.

Hong Kong-founded SenseTime, meanwhile, has been investing heavily in building up its AI infrastructure with Chinese-made chips – including those from Huawei, Cambricon Technologies and Hygon Information Technology – to mitigate risks from the ongoing US-China tech war.

Yang Fan, co-founder of SenseTime and president of its AI infrastructure unit SenseCore, said in April that the number of domestic chips in the firm’s data centres was “growing very fast” and “continues to rise every year”.

Still, the immediate challenge for domestic chip suppliers is meeting the potentially large demand from China’s biggest tech companies, led by Alibaba Group Holding and Tencent Holdings, once they have used up existing inventories of Nvidia chips. Alibaba owns the South China Morning Post.

“Big Tech companies have stepped up their capital expenditure over the past quarters and piled up their inventory,” said Alex Yao, head of China equity research at JPMorgan. “That probably means for the next six to twelve months, they don’t need to worry about computing power.”

In another segment of China’s chip supply chain, Empyrean Technology, Primarius Technologies and Semitronix are getting increased attention as alternative suppliers of electronic design automation (EDA) software after Washington directed the world’s leading vendors to halt sales on the mainland under new US export restrictions.

Top EDA suppliers Cadence Design Systems, Synopsys and Siemens EDA have confirmed that they received notices from the US Commerce Department’s Bureau of Industry and Security about the restrictions on their software, which could be used to develop advanced AI chips.

Empyrean sees both challenges and opportunities in the situation. The firm is currently able to supply around 80 per cent of the total 58 EDA tools used in the entire chipmaking process, said Yu Han, a senior marketing director at Empyrean, at an industry event on Friday.

Yu said Empyrean aims to supply all of those tools eventually, transforming the company into one of the world’s top-tier EDA suppliers. He pointed out that the most difficult part was establishing a solid ecosystem, which requires “collaboration with China’s semiconductor industry”.

Apart from lingering doubts about the efficiency of home-grown processors, users of these chips could also face compliance issues once the AI models they developed were adopted in overseas markets, according to a recent analysis from Shanghai-based semiconductor consultancy ICWise.

JPMorgan’s Yao said Chinese AI model developers put greater focus on the efficiency of their hardware deployment.

But with US tech curbs still in place, Huawei looks poised to benefit as the company continues to raise the bar on AI chip performance using all the techniques at its disposal, while leading China’s efforts in semiconductor self-sufficiency.

When asked about the US sanctions in his People’s Daily interview, Huawei’s Ren said he had rarely given that a thought because it was “useless” to ponder over difficulties.

“I don’t think about difficulties,” he said. “I just move forward one step at a time.”

Ren was not available for an interview, and Huawei’s spokesman declined to comment.

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute AI pháp lý-quản trị-chủ quyền 2025-06-17 06:40:51

Nvidia cảnh báo rằng lệnh cấm xuất khẩu chip AI của Mỹ đang phản tác dụng

Jensen Huang, CEO của Nvidia, cảnh báo rằng các nỗ lực của Mỹ nhằm ngăn Trung Quốc tiếp cận chip AI tiên tiến đang phản tác dụng và thúc đẩy đổi mới công nghệ trong nước Trung Quốc.
Huang nhấn mạnh, giả định rằng Trung Quốc không thể sản xuất chip AI là sai lầm nghiêm trọng. Thay vì bị kìm hãm, Trung Quốc đã tiến nhanh hơn khi bị cắt khỏi chuỗi cung ứng Mỹ.
Trung Quốc đã đầu tư 184 tỷ USD vào các startup AI từ năm 2000 đến 2023. Giá trị ngành AI Trung Quốc (bao gồm hạ tầng và linh kiện) có thể đạt 1.400 tỷ USD vào năm 2030.
Các startup AI hàng đầu tại Trung Quốc gồm: Stepfun, Zhipu AI, Minimax, Moonshot AI, 01.AI và Baichuan Intelligent Technology.
DeepSeek, một startup Trung Quốc, đã gây bất ngờ khi phát triển mô hình AI hiệu suất cao với chi phí chỉ 5,6 triệu USD – so với hàng trăm triệu hoặc hàng tỷ USD từ các ông lớn công nghệ.
DeepSeek dùng chip Nvidia và đạt hiệu suất gần gấp đôi so với các mô hình của OpenAI. Trên bảng xếp hạng Chatbot Arena, DeepSeek và Qwen của Alibaba đang dẫn đầu nhóm mã nguồn mở.
Trung Quốc hiện đã dẫn đầu thế giới về số bằng sáng chế, bài nghiên cứu và trích dẫn trong lĩnh vực AI. Tuy nhiên, Mỹ vẫn có lợi thế trong số lượng startup kỳ lân (690 công ty trị giá 2.530 tỷ USD) so với Trung Quốc (162 công ty trị giá 702,46 tỷ USD).
Theo Stanford, khoảng cách công nghệ giữa Mỹ và Trung Quốc đang thu hẹp nhanh, đặc biệt nhờ đầu tư vào giáo dục, sản xuất chính xác và thị trường vốn.
Nvidia thừa nhận trong báo cáo tài chính quý mới rằng họ buộc phải hủy bỏ 8 tỷ USD đơn đặt hàng chip H20 cho Trung Quốc do lệnh siết xuất khẩu mới từ tháng 4.
Các công ty khác như Qualcomm, Intel và Broadcom cũng phụ thuộc vào Trung Quốc cho tới 40% doanh thu. Thị trường bán dẫn Trung Quốc dự kiến đạt 204,03 tỷ USD trong năm nay, với tăng trưởng kép hàng năm 8,24%.
Lịch sử cho thấy các lệnh cấm thương mại hiếm khi đạt mục tiêu và thường tạo ra hệ sinh thái song song, giống như trường hợp của Nga sau khi bị cấm vận.

📌 Nvidia cảnh báo rằng việc Mỹ hạn chế xuất khẩu chip AI đang thúc đẩy Trung Quốc tăng tốc phát triển công nghệ, trong khi làm thiệt hại đến 8 tỷ USD doanh thu của riêng Nvidia. Với 184 tỷ USD đầu tư và các startup như DeepSeek đang tạo mô hình chất lượng cao với chi phí thấp, Trung Quốc đang nhanh chóng thu hẹp khoảng cách với Mỹ trong cuộc đua AI.

https://asia.nikkei.com/Opinion/US-export-controls-on-AI-chips-are-backfiring

US export controls on AI chips are backfiring

Nvidia warns Washington’s steps are boosting Chinese innovation and hurting American firms

James David Spellman

June 16, 2025 17:05 JST

James D. Spellman is principal of Strategic Communications, a consulting firm based in Washington.

Nvidia CEO Jensen Huang warns that U.S. efforts to block China from accessing advanced AI chips and software are backfiring -- a sharp pivot for a highly visible supporter of President Donald Trump.

China is now fully capable of developing its own AI tools despite restrictions designed to prevent its technological ascent, according to Huang. Washington's "fortress" strategy has accelerated Chinese innovation while escalating a broader geopolitical contest for hegemony over critical technologies and rare-earth minerals.

"The U.S. has based its policy on the assumption that China cannot make AI chips," Huang said during an earnings call in May. "That assumption was always questionable, and now it's clearly wrong. ... China's AI moves on with or without the U.S. chips. Shielding Chinese chipmakers from the U.S. competition only strengthens them abroad and weakens America's position."

China's stake in artificial intelligence is deeply moored. Venture funds backed by the Chinese government invested $184 billion into AI startups between 2000 and 2023, according to a Morgan Stanley report last month. The sector's value plus related industries, including infrastructure and component suppliers, could reach $1.4 trillion by 2030. "Six tigers" -- Stepfun, Zhipu AI, Minimax, Moonshot AI, 01.AI and Baichuan Intelligent Technology -- dominate among some 4,300 AI companies.

The Chinese startup DeepSeek upended investors' assumptions about AI's trajectory by demonstrating in January that high-performing models can be developed at a fraction of the stratospheric costs that tech giants are paying -- $5.6 million versus hundreds of millions, if not billions, more. DeepSeek used Nvidia chips to match OpenAI's quality and operating at nearly twice the speed.

On the scorecard Chatbot Arena, DeepSeek and Alibaba's Qwen lead the best open language models. By one count, China has already secured the top position in AI-related patents, research papers and citations. Yet, by another measure, the U.S. endeavors far exceed those of China. There are 690 privately held U.S. tech companies worth more than $1 billion, representing $2.53 trillion in combined value, compared to China's 162 businesses worth $702.46 billion.

Alibaba's Qwen is one of the most high-profile open language model in China. © Reuters

But the distance between the frontier and the herd is narrowing quickly, a Stanford University assessment concludes. The U.S. lead is shrinking as competitors leapfrog forward in education, capital markets, high-precision manufacturing and technological prowess.

"They're not scared," said Jamie Dimon, JPMorgan Chase's chief executive, after a recent trip to China. "They put 100,000 engineers on it." In January, Ruth Porat, president and chief investment officer at Alphabet, forecast that the U.S. is "probably a year-plus ahead in models."

Nvidia's quarterly filing admitted for the first time that restrictions on China will hurt business. In the current quarter, Nvidia said $8 billion in planned orders for its dumbed-down H20 chip must now be scrapped after Trump tightened export-licensing in April.

The disclosure reveals deep, wide-ranging interdependencies that also entangle other American chipmaking firms -- Qualcomm, Intel and Broadcom -- with the world's second-largest economy for up to 40% of revenues. China's semiconductor market is projected to reach $204.03 billion this year and continue growing at a compound annual growth rate of 8.24%.

Trade restrictions rarely achieve their intended goals. Instead, they often generate unforeseen and adverse consequences. We've witnessed that most recently with economic penalties on Russia after invading Ukraine. Barriers encourage the emergence of parallel ecosystems, the networks of businesses, workers, investors, customers and institutions that depend on and support each other. Protectionism may buy time -- but not necessarily victory.

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute AI pháp lý-quản trị-chủ quyền 2025-06-17 06:36:59

Nvidia đang nhắm cơ hội 1.500 tỷ USD với chiến lược "AI chủ quyền" – cuộc đua mới trong lĩnh vực AI quốc gia

Nvidia đang định vị lại chiến lược dài hạn của mình với trọng tâm là "AI chủ quyền" (Sovereign AI), hướng tới xây dựng hạ tầng AI riêng biệt cho từng quốc gia.
CEO Jensen Huang gần đây đã giới thiệu khái niệm này trong chuyến công du châu Âu, nơi các nhà lãnh đạo ủng hộ việc phát triển trung tâm dữ liệu, phần cứng và phần mềm AI riêng phục vụ mục tiêu quốc gia.
Theo Oppenheimer, thị trường AI chủ quyền có thể đạt giá trị tới 1.500 tỷ USD, riêng châu Âu đóng góp khoảng 120 tỷ USD.
Một trung tâm dữ liệu AI quy mô gigawatt có thể mang về cho Nvidia tới 50 tỷ USD doanh thu nhờ khả năng cung cấp trọn bộ giải pháp AI từ chip đến phần mềm.
Nvidia đang trở thành "nhà cung cấp vũ khí" trong một cuộc chạy đua mới – cuộc đua kiểm soát công nghệ AI, thay vì chỉ thuê dịch vụ đám mây từ các ông lớn như AWS.
Mô hình này phù hợp với bối cảnh địa chính trị đang căng thẳng, nơi các quốc gia ưu tiên kiểm soát dữ liệu và hạ tầng AI như tài sản chiến lược.
Nvidia có lợi thế rõ rệt nhờ sở hữu chip GPU mạnh nhất và hệ sinh thái phần mềm CUDA mà đối thủ khó thay thế.
Oppenheimer duy trì xếp hạng "Outperform" cho cổ phiếu NVDA, nâng mục tiêu giá lên 175 USD.
Tuy nhiên, cổ phiếu Nvidia hiện đối mặt với thách thức định giá cao, đã tăng hơn 200% trong năm qua. Cổ phiếu này đang giao dịch ở mức 142,99 USD, và giá mục tiêu trung bình là 172,36 USD (tăng 21%).
Theo TipRanks, trong số 40 chuyên gia phân tích: 35 khuyến nghị "Mua", chỉ 1 người khuyên "Bán", xác nhận xếp hạng "Mua mạnh".

📌 Nvidia đang mở ra một cơ hội trị giá 1.500 tỷ USD thông qua chiến lược AI chủ quyền, nhắm tới thị trường chính phủ và quốc gia. Với doanh thu tiềm năng 50 tỷ USD từ mỗi trung tâm dữ liệu, cùng lợi thế chip và phần mềm độc quyền, Nvidia có thể định hình cuộc đua AI toàn cầu. Dù định giá cao là rào cản, nhưng triển vọng tăng trưởng dài hạn vẫn rất hấp dẫn.

https://www.tipranks.com/news/sovereign-ai-could-be-nvidias-next-trillion-dollar-tailwind

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-06-14 00:38:40

Temasek bắt tay Microsoft và BlackRock đầu tư tới 100 tỷ USD vào hạ tầng AI

Temasek, quỹ đầu tư quốc gia của Singapore, đã chính thức gia nhập liên minh AI Infrastructure Partnership (AIP) cùng với Microsoft, BlackRock và MGX, theo thông tin từ bản trình bày của BlackRock trong ngày hội nhà đầu tư.
AIP được thành lập vào tháng 9 với mục tiêu ban đầu đầu tư hơn 30 tỷ USD vào các dự án liên quan đến trí tuệ nhân tạo, bao gồm xây dựng trung tâm dữ liệu và cơ sở hạ tầng năng lượng phục vụ cho các ứng dụng AI như ChatGPT.
Liên minh này có tham vọng huy động tới 100 tỷ USD (bao gồm tài trợ nợ) để triển khai các khoản đầu tư lớn, tập trung chủ yếu tại Hoa Kỳ.
Trước đó, Cơ quan Đầu tư Kuwait (Kuwait Investment Authority) cũng đã gia nhập AIP đầu tháng 6, trở thành nhà đầu tư tài chính đầu tiên không thuộc nhóm sáng lập.
Các đối tác quan trọng khác của AIP bao gồm Nvidia và xAI của tỷ phú Elon Musk, cho thấy sức hút mạnh mẽ từ giới công nghệ lẫn tài chính toàn cầu.
Ravi Lambah, trưởng bộ phận sáng kiến chiến lược của Temasek, cho biết khoản đầu tư này phản ánh cam kết của họ vào các xu hướng lớn và dài hạn, đặc biệt là AI – công nghệ có khả năng định hình lại mọi lĩnh vực và doanh nghiệp.
Dù Temasek không tiết lộ chi tiết tài chính về khoản đầu tư, công ty này hiện có giá trị danh mục ròng đạt 389 tỷ SGD (tương đương khoảng 304 tỷ USD) tính đến ngày 31 tháng 3 năm 2024.
Tỷ giá quy đổi được sử dụng là 1 USD = 1,2804 SGD.

📌 Temasek gia nhập liên minh AI Infrastructure Partnership cùng Microsoft, BlackRock và MGX để góp phần đầu tư vào cơ sở hạ tầng AI với mục tiêu huy động đến 100 tỷ USD. Dự án tập trung vào Mỹ, bao gồm trung tâm dữ liệu và năng lượng. Việc nhiều tổ chức lớn như Nvidia và xAI tham gia cho thấy mức độ quan tâm toàn cầu đối với AI. Temasek sở hữu danh mục 304 tỷ USD tính đến tháng 3/2024.

https://www.reuters.com/world/asia-pacific/temasek-joins-microsoft-blackrock-mgx-develop-ai-infrastructure-2025-06-12/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute AI pháp lý-quản trị-chủ quyền 2025-06-14 00:20:52

Các công ty AI Trung Quốc lén mang ổ cứng qua biên giới để “lách” lệnh cấm chip Mỹ

Kể từ năm 2022, Mỹ đã siết chặt lệnh cấm xuất khẩu chip AI cao cấp sang Trung Quốc do lo ngại an ninh quốc gia, buộc các công ty Trung Quốc phải tìm cách lách luật.
Tháng 3/2025, 4 kỹ sư Trung Quốc bay từ Bắc Kinh đến Malaysia mang theo 15 ổ cứng (80 terabyte dữ liệu) trong vali để huấn luyện mô hình AI tại một trung tâm dữ liệu có 300 server dùng chip Nvidia.
Thay vì vận chuyển chip lậu (ngày càng khó), các công ty AI Trung Quốc chuyển sang phương án mang dữ liệu ra nước ngoài để huấn luyện mô hình tại nơi còn có thể tiếp cận chip Mỹ.
Họ mất hơn 8 tuần để chuẩn bị và tối ưu dữ liệu trước khi rời Trung Quốc nhằm tránh việc phải chỉnh sửa tại chỗ.
Dữ liệu huấn luyện gồm bảng tính, ảnh và video clip; sau khi xử lý, họ mang về hàng trăm GB dữ liệu chứa tham số mô hình AI.
Để tránh bị phát hiện, ổ cứng được chia nhỏ ra nhiều vali khác nhau thay vì gom vào một như trước.
Công ty Trung Quốc này dùng một công ty vỏ bọc tại Malaysia do 3 công dân Malaysia làm giám đốc và có công ty mẹ đăng ký ở nước ngoài để giảm kiểm soát.
Malaysia đã nhập khẩu 3,4 tỷ USD chip AI và bộ xử lý từ Đài Loan chỉ trong tháng 3 và 4/2025 – vượt cả tổng lượng nhập của năm 2024.
Trung tâm dữ liệu ở Đông Nam Á bùng nổ, với 2.000 megawatt công suất tại Singapore, Malaysia, Thái Lan và Indonesia – ngang bằng London và Frankfurt cộng lại.
Nvidia gần đây đã ký nhiều thỏa thuận bán chip cho Saudi Arabia, Qatar và UAE, mở rộng thị trường cho các công ty AI Trung Quốc ở Trung Đông.
Một quỹ đầu tư Malaysia đã bỏ 5 triệu USD mua hàng trăm server Nvidia để cho thuê lại, nhắm vào thị trường Trung Quốc và Singapore.

📌 Các công ty AI Trung Quốc đang khéo léo lách lệnh cấm chip AI của Mỹ bằng cách mang dữ liệu sang Đông Nam Á như Malaysia để huấn luyện mô hình trên server có chip Nvidia. Chỉ riêng tháng 3 và 4/2025, Malaysia đã nhập chip trị giá 3,4 tỷ USD. Thị trường này đang phát triển mạnh, trở thành điểm nóng cho cả công ty Trung Quốc và phương Tây.

https://www.wsj.com/tech/china-ai-chip-curb-suitcases-7c47dab1

#WSJ

Chinese AI Companies Dodge U.S. Chip Curbs by Flying Suitcases of Hard Drives Abroad

Engineers carry data to countries where Nvidia chips are available, frustrating Washington’s aims

Raffaele Huang

and

Liza Lin

June 12, 2025 11:00 pm ET

Emil Lendof/WSJ, iStock

KUALA LUMPUR, Malaysia—In early March, four Chinese engineers flew to Malaysia from Beijing, each carrying a suitcase packed with 15 hard drives. The drives contained 80 terabytes of spreadsheets, images and video clips for training an artificial-intelligence model.

At a Malaysian data center, the engineers’ employer had rented about 300 servers containing advanced Nvidia chips. The engineers fed the data into the servers, planning to build the AI model and bring it back home.

Since 2022, the U.S. has tightened the noose around the sale of high-end AI chips and other technology to China over national-security concerns. Yet Chinese companies have made advances using workarounds.

In some cases, Chinese AI developers have been able to substitute domestic chips for the American ones. Another workaround is to smuggle AI hardware into China through third countries. But people in the industry say that has become more difficult in recent months, in part because of U.S. pressure.

That is pushing Chinese companies to try a further option: bringing their data outside China so they can use American AI chips in places such as Southeast Asia and the Middle East.

The maneuvers are testing the limits of U.S. restrictions. “This was something we were consistently concerned about,” said Thea Kendler, who was in charge of export controls at the Commerce Department in the Biden administration, referring to Chinese companies remotely accessing advanced American AI chips.

Layers of intermediaries typically separate the Chinese users of American AI chips from the U.S. companies—led by Nvidia—that make them. That leaves it opaque whether anyone is violating U.S. rules or guidance.

The Biden administration proposed in its final days to set country-specific caps on purchases of American chips—a move that would have made it harder for countries such as Malaysia to serve Chinese demand. Kendler said overseas buyers of U.S. chips would have had to agree to national-security conditions limiting use of the chips, and such restrictions could have included a bar on Chinese companies accessing them.

The Trump administration said in May it would scrap the proposed country caps because it said it didn’t want to place an unnecessary regulatory burden on Nvidia and other U.S. companies. However, it issued guidance warning U.S. companies that they need to take steps to prevent customers from using U.S. AI chips to train Chinese AI models.

The Commerce Department and Malaysia’s Ministry of Investment, Trade and Industry didn’t respond to requests for comment.

Careful planning

At the Chinese AI developer, the Malaysia game plans take months of preparation, say people involved in them. Engineers decided it would be fastest to fly physical hard drives with data into the country, since transferring huge volumes of data over the internet could take months.

Before traveling, the company’s engineers in China spent more than eight weeks optimizing the data sets and adjusting the AI training program, knowing it would be hard to make major tweaks once the data was out of the country.

The Chinese engineers had turned to the same Malaysian data center last July, working through a Singaporean subsidiary. As Nvidia and its vendors began to conduct stricter audits on the end users of AI chips, the Chinese company was asked by the Malaysian data center late last year to work through a Malaysian entity, which the companies thought might trigger less scrutiny.

The Chinese company registered an entity in Kuala Lumpur, Malaysia’s capital, listing three Malaysian citizens as directors and an offshore holding company as its parent, according to a corporate registry document.

To avoid raising suspicions at Malaysian customs, the Chinese engineers packed their hard drives into four different suitcases. Last year, they traveled with the hard drives bundled into one piece of luggage.

They returned to China recently with the results—several hundred gigabytes of data, including model parameters that guide the AI system’s output.

The procedure, while cumbersome, avoided having to bring hardware such as chips or servers into China. That is getting more difficult because authorities in Southeast Asia are cracking down on transshipments through the region into China.

In February, Singaporean authorities accused three people of lying about the ultimate destination of Nvidia servers worth millions of dollars that they had procured. Lawyers for the three didn’t respond to requests for comment. Singapore authorities have said that while they aren’t legally obliged to enforce other countries’ export controls, they won’t condone businesses using their association with Singapore to avoid the controls.

Southeast Asia boom

Computing centers are quickly sprouting up in Southeast Asia, serving both Western and Chinese customers.

Data-center capacity is often measured in power consumption, and real-estate-services company Jones Lang LaSalle estimates there are nearly 2,000 megawatts of data-center capacity in Singapore, Malaysia, Thailand and Indonesia. That is equivalent to the combined capacity in London and Frankfurt, Europe’s biggest data-center markets.

Earlier this year, a Beijing-based tech firm took over a lease for 200 AI servers that a data center in Malaysia had originally earmarked for an American cloud-computing company, according to people familiar with the arrangement.

In recent months, companies have rushed to purchase chips developed by Nvidia and Advanced Micro Devices to install in data centers in Southeast Asia. The Trump administration for now isn’t moving ahead with caps on those nations’ chip purchases.

An Nvidia representative said, “Ensuring that the world’s cloud services run on American infrastructure, and not on our foreign competition, promotes national and economic security and helps the U.S. set global AI standards.”

President Trump and Nvidia CEO Jensen Huang looked on as U.S. and U.A.E. officials signed an AI pact in Abu Dhabi last month.

Malaysia imported $3.4 billion in AI chips and other processors from Taiwan in March and April, more than the total imports of such chips in 2024, according to Taiwan’s International Trade Administration.

Some in the industry said the Middle East was likely to grow as a destination for Chinese AI developers. During a recent visit by President Trump to the region, Nvidia announced deals to sell hundreds of thousands of AI chips to Saudi Arabia, Qatar and the United Arab Emirates.

In January, Adam Ooi, a director at a Malaysia-based family office, invested $5 million in a fund that acquires AI servers for leasing. After securing customers in China, Singapore and Indonesia, the fund manager purchased hundreds of Nvidia servers for installation in a data center in Malaysia.

“They convinced me that it’s a business with promised returns and that we should move fast before the rules tighten up,” Ooi said.

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-06-11 23:59:19

Huawei phát triển thành công bộ công cụ thiết kế EDA 14nm nội địa để sản xuất chip Kirin 9020

Huawei đã tự phát triển thành công bộ công cụ EDA 14nm – yếu tố thiết yếu trong thiết kế và xác minh vi mạch – để tự chủ sản xuất chip Kirin 9020, sau khi bị Mỹ cấm tiếp cận công cụ từ các hãng quốc tế.
EDA (Electronic Design Automation) không trực tiếp sản xuất chip, nhưng cực kỳ quan trọng trong thiết kế cấu trúc chip tiên tiến như GAAFET ở tiến trình 2nm và 3nm.
Huawei bắt đầu hợp tác cùng các công ty EDA trong nước từ tháng 3/2023, và đến nay được cho là đã làm chủ hoàn toàn công cụ EDA cho tiến trình 14nm.
Chip Kirin 9020, được giới thiệu trên dòng Mate 70 năm ngoái, sẽ được sản xuất hàng loạt bằng bộ EDA nội địa này và nhiều khả năng cũng sẽ dùng trên dòng Pura 80.
Tuy nhiên, Huawei vẫn phụ thuộc vào SMIC và công nghệ in DUV (Deep Ultraviolet) để sản xuất chip Kirin ở tiến trình 7nm – mức giới hạn hiện tại do thiếu máy in EUV.
EUV (Extreme Ultraviolet Lithography) là công nghệ then chốt để sản xuất chip 5nm và thấp hơn với hiệu suất cao và tỷ lệ hỏng thấp – hiện chỉ ASML (Hà Lan) cung cấp.
Đối tác của Huawei là SiCarrier đang nỗ lực phát triển máy EUV thay thế, với khoản gọi vốn ước tính 2,8 tỷ USD, nhưng cần thêm vài năm để đạt hiệu quả tương đương ASML.
Với công cụ EDA nội địa, Huawei có thể tiến gần đến tự chủ chuỗi sản xuất bán dẫn, nhưng vẫn còn rào cản lớn về thiết bị sản xuất tiên tiến.
Những hãng khác như Xiaomi dù muốn phát triển chip cạnh tranh Qualcomm hay Apple, cũng không thể dùng công cụ EDA cũ cho tiến trình 2-3nm, có thể buộc hai công ty Trung Quốc hợp tác trong tương lai để phát triển EDA thế hệ mới.

📌 Huawei đã phát triển thành công công cụ EDA 14nm để sản xuất chip Kirin 9020 nhưng vẫn bị giới hạn ở tiến trình 7nm do thiếu công nghệ EUV. Dù là bước tiến lớn hướng tới tự chủ bán dẫn, Huawei và SMIC vẫn cần vài năm nữa để tiếp cận tiến trình dưới 5nm. SiCarrier đang nỗ lực phát triển máy EUV thay thế ASML với vốn 2,8 tỷ USD.

https://wccftech.com/huawei-developing-own-14nm-eda-tools-for-the-kirin-9020/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-06-11 23:54:48

Cisco cảnh báo mạng đang trở thành nút thắt cổ chai lớn nhất của AI

Cisco nhận định sự gia tăng nhanh chóng của AI agents (cả phần mềm và robot vật lý) sẽ tạo ra "bùng nổ nhân lực kỹ thuật số", gây áp lực chưa từng có lên hạ tầng mạng doanh nghiệp.
Kết nối mạng – từng được xem là nền tảng ổn định – nay trở thành rào cản lớn cho chuyển đổi số nếu không được tái cấu trúc theo hướng AI-ready và an toàn.
Cisco đề xuất 3 trụ cột cho mạng AI-ready:
1. Thiết bị mạng linh hoạt, mở rộng tốt, an toàn
2. Tích hợp bảo mật vào lõi mạng (thay vì gắn ngoài)
3. AgenticOps – sử dụng AI để hỗ trợ vận hành, giảm gánh nặng thiếu nhân lực IT
Bộ switch mới C9350 và C9610 của Cisco kết hợp chip xử lý đồng thời cho dữ liệu và bảo mật, tích hợp sâu với Cisco Silicon One, cho phép chạy AI-native và bảo mật mà không làm chậm hiệu năng.
Khái niệm "micro perimeter" – tạo vành đai bảo vệ từng dịch vụ riêng biệt – giúp nâng cao an toàn trong môi trường trung tâm dữ liệu và mạng campus.
Cisco mở rộng kiến trúc bảo mật sang campus và chi nhánh, với bảo mật 3 lớp: thiết bị, kết nối và người dùng/ứng dụng/thiết bị.
- Có thể mã hóa bằng thuật toán hậu lượng tử.
- Chính sách bảo mật đồng bộ qua toàn bộ hệ thống nhờ Cisco Hybrid Mesh Firewall.
Cookies và lịch sử truy cập giúp AI trong trình duyệt hiểu người dùng, từ đó thực hiện được các hành động tự động như đặt lịch, xử lý sự cố, giúp quản trị viên tiết kiệm thời gian.
AI Canvas của Cisco tạo không gian làm việc cộng tác cho các nhóm NetOps, SecOps và DevOps, nơi AI cung cấp biểu đồ, đề xuất cấu hình và hỗ trợ xử lý sự cố qua giao diện trò chuyện.
Hệ thống giám sát chủ động và đo lường tổng thể với ThousandEyes và các thuật toán tương quan đa tầng giúp phát hiện, xử lý sự cố mạng trước khi ảnh hưởng người dùng.
Cisco khẳng định mạng không còn chỉ là nền tảng kết nối, mà sẽ trở thành nền tảng thông minh chủ động đảm bảo trải nghiệm số, với sự hỗ trợ của AI và kiến trúc bảo mật tiên tiến.

📌 Cisco nhấn mạnh mạng đang là rào cản chính của AI và đề xuất kiến trúc mới với switch thông minh C9350/C9610, bảo mật hậu lượng tử, và AgenticOps. AI sẽ chủ động vận hành mạng, giám sát hiệu suất, phân tích rủi ro và tối ưu hóa kết nối. Giải pháp giúp giảm chi phí, tiết kiệm năng lượng và đảm bảo bảo mật toàn diện trong môi trường AI phát triển nhanh.

https://venturebeat.com/business/cisco-explains-why-the-network-is-ais-looming-bottleneck/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-06-11 23:33:54

Nguồn cung bismuth cạn kiệt do Trung Quốc siết chặt xuất khẩu khiến các nhà cung ứng DC AI khủng hoảng

Trung Quốc siết chặt xuất khẩu bismuth và các khoáng sản quan trọng từ tháng 4, khiến chuỗi cung ứng linh kiện cho trung tâm dữ liệu AI như của Nvidia, Amazon và Google bị gián đoạn nghiêm trọng.
Bismuth là nguyên liệu chủ chốt trong hợp kim hàn nhiệt độ thấp, sử dụng để gắn linh kiện lên bảng mạch in và module tản nhiệt cho máy chủ AI.
Giá bismuth ngoài Trung Quốc đã tăng vọt 460%, lên mức khoảng 35 USD/pound (~77.000 đồng/pound), theo Refinitiv.
Trung Quốc kiểm soát 69% sản lượng bismuth toàn cầu. Do đó, bất kỳ hạn chế nào từ nước này đều tác động lớn đến thị trường toàn cầu.
Các nhà cung cấp linh kiện cho Nvidia, Amazon, Google chỉ còn đủ hàn nhiệt độ thấp dùng trong 1,5 tháng nữa. Họ đang chờ đợi vào kết quả đàm phán giữa Donald Trump và Tập Cận Bình.
Dù chưa bị cấm hoàn toàn, việc Trung Quốc kéo dài quy trình kiểm duyệt khiến việc vận chuyển nguyên liệu bị đình trệ. Hải quan thậm chí mở hộp kiểm tra từng lọ hàn.
Một số công ty như Shenmao Technology đang nỗ lực tìm nguồn bismuth từ Mexico, Việt Nam… nhưng nguồn cung vẫn rất khan hiếm.
Các giải pháp thay thế không dùng bismuth lại đắt hơn, gây áp lực lớn về chi phí.
Ngoài bismuth, nhiều nguyên liệu khác như neodymium, tungsten, graphite, magnesium cũng bị đưa vào diện kiểm soát chặt.
Công ty Pegatron (cung cấp cho Apple và Tesla) và Yageo (cung ứng cho Nvidia) cho biết đã phải thay đổi thiết kế và vật liệu để đối phó, nhưng quá trình này tốn thời gian và nguồn lực.
Dù Mỹ từng cảnh báo từ năm 2021 về sự phụ thuộc vào khoáng sản Trung Quốc, đến nay vẫn chưa có giải pháp thay thế hiệu quả.

📌 Khủng hoảng nguồn cung bismuth do Trung Quốc kiểm soát 69% sản lượng toàn cầu đang gây gián đoạn nghiêm trọng cho các nhà cung cấp AI như Nvidia, Amazon, Google. Giá bismuth tăng 460%, tồn kho hàn nhiệt độ thấp chỉ còn đủ dùng trong 1,5 tháng. Dù đàm phán Mỹ-Trung đạt “khung thỏa thuận”, chuỗi cung ứng vẫn đang đối mặt áp lực lớn và cần thời gian dài để tìm nguồn thay thế bền vững.

https://asia.nikkei.com/Spotlight/Supply-Chain/China-s-critical-mineral-curbs-shake-AI-data-center-suppliers2

China's critical mineral curbs shake AI data center suppliers

Vital bismuth inventories running low, warn suppliers to Nvidia and others

Bismuth is a key ingredient in tech manufacturing, including production of AI data center servers. (Nikkei montage)

CHENG TING-FANG and LAUY LI

June 11, 2025 14:56 JST

TAIPEI -- Tech companies building AI data centers for Nvidia, Amazon and Google are counting on a breakthrough in U.S.-China trade negotiations as their stockpiles of critical minerals and related materials run painfully low.

China tightened its restrictions on critical elements used in tech manufacturing in April amid trade tensions with the U.S. Since then, prices of these elements have surged, and supplies of materials that use them, such as low-temperature solder paste, can be measured in weeks, executives from multiple suppliers told Nikkei Asia.

Low-temperature solder paste is essential for mounting components onto printed circuit boards and thermal modules and for other key manufacturing steps, sources said. It requires an alloy of tin and bismuth, the latter of which is subject to Chinese export restrictions.

"Our inventory of low-temperature solder paste, critical for building AI servers and thermal management solutions, is now running low," an executive at a supplier to Nvidia, Amazon and Google told Nikkei Asia.

"While China isn't fully blocking exports, the prolonged review processes are already disrupting the supply chain," the executive said. "We have stockpiled some inventory in the region, but it will only last about 1.5 months. We are now counting on presidents [Donald] Trump and Xi [Jinping] to have favorable talks and reach an agreement."

Top trade representatives from the two countries met in London this week to discuss the trade situation and announced on Tuesday that they had reached a "framework" agreement involving critical minerals and chips. Few details were given, however.

Another executive with the above Nvidia, Amazon and Google supplier said his company has been counting on talks between the U.S. and China turning things around. "These kinds of things can be solved with just a few words by politicians," the executive said.

An executive with a thermal solutions supplier to Nvidia and AWS said his company has been looking for non-bismuth solder paste alternatives since April, but was surprised to find these were even pricier.

"We didn't stockpile solder paste before April, so we've been paying several times more to buy it in recent months," the executive told Nikkei Asia. "And guess what? The non-bismuth solutions are even more expensive!"

Bismuth is an increasingly popular choice for electronics and other applications. It has a low toxicity, and its low melting point means it consumes less energy during the manufacturing process. China controls 69% of global bismuth production, according to a study by the European Union. Bismuth-containing solder paste is also essential in some thermal management modules, critical components for AI supercomputers and data centers.

The price of non-China global bismuth has surged 460% to about $35 per pound since at the start of the year, according to Refinitiv.

"Currently the solder paste containing bismuth in non-China manufacturing hubs is in short supply," a senior executive of Shenmao Technology, one of the world's leading solder paste makers, told Nikkei Asia. "We are also trying to source bismuth from Mexico, Vietnam and other places and hope to accelerate to meet customer demand."

This is not the first time China has weaponized its supply of rare earths and other minerals. Late last year, Beijing published lists of "dual-use" metals and materials, including tungsten, graphite and magnesium, that would be subject to more stringent export controls. China holds a strong grip on refining and production of all of these elements.

Scrutiny by Chinese customs of shipments containing any rare earths or other restricted metals - including the low-temperature solder paste - has increased in the past month, sources said.

"The checks have become quite strict and it is becoming increasingly challenging for us to ship without reporting and waiting for reviews," one of the supply chain executives said. "They will even open the boxes and jars to check closely."

Supplies of neodymium, used for making high-performance permanent magnets widely used in motors, speakers and many other applications, have also been hit by China's curbs.

Regardless of the ultimate outcome of talks in London or beyond, rare earths and critical minerals will likely remain a key battlefield in U.S.-China tech tensions. In a supply chain review in 2021, Washington identified rare earth supplies as a key vulnerability, though the country made little progress in diversifying its sources in the intervening years.

Johnson Deng, co-CEO of Apple and Tesla supplier Pegatron, said the rare earth bottlenecks have been a "pain" for the past two or three months.

"It really has been a pain for me," Deng told reporters after the iPhone assembler's annual general meeting in Taipei. "We immediately launched responsive measures since April, including close communication with clients to change materials, change designs and go through the process of qualification."

He said Pegatron has been trying to source rare earths, like neodymium, outside of China, such as from Australia. "But honestly, we must say, China really is at the forefront in terms of the supply and the quality for these rare earths."

Founding Chairman Pierre Chen of Yageo, an Apple and Nvidia component supplier, said the restrictions on rare earth and key metals could cause some supply disruptions, but added that many electronics makers are working to find alternative base sources.

"It's indeed a challenging task for the supply chain. But we are seeing that nations have started to look for alternative sources in Africa, in Canada and elsewhere," Chen said. "Some companies are even starting from product design to come up with ways to use more diversified sources or change the materials. But such shifts and diversification of sources will need time and effort."

Không có file đính kèm.

Nguồn tham khảo

Semi-Cloud-DC-Green AI chips-hardware-compute 2025-06-10 21:04:15

Trung Quốc thống trị ngành công nghiệp chip như thế nào: Chiến lược bất chấp lệnh cấm vận của Mỹ

Vào tháng 3 năm 2025, một nhóm từ Đại học Bắc Kinh đã công bố một thành tựu đột phá về hiệu suất chất bán dẫn mà không cần sử dụng silicon.
Trung Quốc đã đặt mục tiêu giải quyết các rủi ro do sự phụ thuộc vào nước ngoài trong chuỗi giá trị chất bán dẫn, nhằm đảm bảo năng lực trong nước và tăng cường sự thống trị toàn cầu.
Hoa Kỳ và các đồng minh đã bắt đầu đầu tư để đảm bảo năng lực sản xuất chất bán dẫn trong nước, ví dụ như Đạo luật CHIPS và Khoa học.
Mặc dù Hoa Kỳ kiểm soát xuất khẩu công nghệ sang Trung Quốc, Bắc Kinh vẫn tiếp tục mở rộng năng lực và ảnh hưởng.
Các công ty bán dẫn hàng đầu của Hoa Kỳ phụ thuộc vào sản xuất, kiểm tra và đóng gói của Trung Quốc, cũng như lắp ráp sản phẩm điện tử hạ nguồn.
Trung Quốc nắm giữ vị trí thống trị trong sản xuất và chế biến nhiều loại nguyên liệu thô liên quan đến chất bán dẫn, bao gồm gallium, germanium, magie, graphite tự nhiên, scandium, vonfram và toàn bộ các nguyên tố đất hiếm.
Bắc Kinh chú trọng vào sản xuất chip thế hệ thứ ba làm từ gallium nitride, silicon carbide và indium phosphide, phù hợp cho xe điện, trung tâm dữ liệu và năng lượng tái tạo.
Trung Quốc có các nhà vô địch trong lĩnh vực này, như Zhongji Innolight, nhà cung cấp giải pháp mô-đun quang học hàng đầu thế giới.
Hoa Kỳ chưa hiểu rõ vị thế của Trung Quốc trong chuỗi giá trị bán dẫn toàn cầu và cách Bắc Kinh cạnh tranh để giành toàn bộ chuỗi giá trị.

📌 Trung Quốc đang củng cố vị thế của mình trong ngành công nghiệp bán dẫn bằng cách tập trung vào toàn bộ chuỗi giá trị, từ nguyên liệu thô đến sản xuất chip tiên tiến. Mặc dù Hoa Kỳ đã áp đặt các biện pháp kiểm soát xuất khẩu, Trung Quốc vẫn tiếp tục phát triển và tìm kiếm sự tự chủ, đặc biệt trong các lĩnh vực như chip thế hệ thứ ba và các nguyên liệu quan trọng. Để cạnh tranh hiệu quả, Hoa Kỳ cần hiểu rõ hơn về chiến lược của Trung Quốc và tăng cường đầu tư vào các giải pháp thay thế.

https://www.hinrichfoundation.com/research/wp/tech/understanding-how-china-secured-its-chip-stack/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-06-09 21:14:23

Trung Quốc bắt đầu sản xuất hàng loạt chip AI phi nhị phân đầu tiên thế giới

Trung Quốc đã bắt đầu sản xuất hàng loạt chip AI phi nhị phân đầu tiên thế giới, do nhóm nghiên cứu của Giáo sư Li Hongge tại Đại học Hàng không Vũ trụ Bắc Kinh (Beihang University) dẫn đầu.
Công nghệ Hybrid Stochastic Number (HSN) là bước đột phá, kết hợp logic nhị phân với logic xác suất, giúp tăng khả năng chống nhiễu, chịu lỗi cao và hiệu quả năng lượng vượt trội.
Chip mới khắc phục hai “bức tường” công nghệ quan trọng của máy tính hiện nay: power wall (tường năng lượng) và architecture wall (tường kiến trúc), vốn là giới hạn của hệ thống nhị phân và chip không dựa trên silicon.
Logic xác suất sử dụng tần suất tín hiệu điện áp cao thay vì phép toán chính xác, giúp giảm đáng kể phần cứng cần thiết nhưng chậm hơn. HSN khắc phục nhược điểm này bằng cách kết hợp với tính nhanh của nhị phân.
Nhóm đã ứng dụng công nghệ này để phát triển chip thông minh dành cho màn hình cảm ứng năm 2023, sản xuất bằng quy trình 110nm của SMIC và tiếp tục phát triển chip nhân ML hiệu suất cao bằng công nghệ 28nm CMOS, công bố trên Microelectronics Journal đầu năm nay.
Chip tích hợp in-memory computing, giúp xử lý dữ liệu tại chỗ thay vì phải truyền qua lại giữa bộ nhớ và CPU, từ đó tiết kiệm năng lượng.
Thiết kế System-on-Chip (SoC) cho phép xử lý song song nhiều nhiệm vụ, vượt qua giới hạn của kiến trúc đồng nhất truyền thống.
Ứng dụng thực tế gồm:
- Nhận diện cảm ứng: lọc nhiễu, phát hiện tín hiệu yếu, tăng trải nghiệm người dùng
- Màn hình điều khiển công cụ: xử lý dữ liệu chính xác, tiêu thụ điện năng thấp
- Hệ thống điều khiển bay: đảm bảo điều hướng ổn định và chính xác
Đội ngũ đang xây dựng kiến trúc tập lệnh riêng (ISA) cho logic xác suất lai, mở rộng tiềm năng chip trong xử lý giọng nói, hình ảnh và tăng tốc mô hình AI lớn.
Độ trễ tính toán trên chip đạt mức micro-giây, cân bằng giữa hiệu năng cao và khả năng lập trình linh hoạt.

📌 Trung Quốc dẫn đầu cuộc đua công nghệ với chip AI phi nhị phân đầu tiên thế giới, vượt qua rào cản silicon truyền thống bằng logic xác suất lai. Ứng dụng thực tế từ điều khiển cảm ứng đến điều hướng máy bay, chip HSN mở ra kỷ nguyên điện toán hiệu quả năng lượng cao, có thể tăng tốc cả AI và xử lý đa phương tiện trong tương lai gần.

https://www.scmp.com/news/china/science/article/3313349/beyond-1s-and-0s-china-starts-mass-production-worlds-first-non-binary-ai-chip

Beyond 1s and 0s: China starts mass production of world’s first non-binary AI chip

China’s AI chip overcomes traditional computing barriers and will be used in touch displays, flight systems and aircraft navigation

Zhang Tongin Beijing

Published: 10:00am, 9 Jun 2025|Updated: 10:29am, 9 Jun 2025

China has initiated the world’s first large-scale application of non-binary AI chips, integrating its proprietary hybrid computing technology into critical sectors including aviation and industrial systems.

Spearheaded by Professor Li Hongge’s team at Beihang University in Beijing, this breakthrough overcomes fundamental barriers in traditional computing by merging binary and stochastic logic, enabling unprecedented fault tolerance and power efficiency in intelligent control applications like touch displays and flight systems while sidestepping US chip restrictions.

Today’s chip technologies face two big challenges: the power wall and the architecture wall, Li told the Beijing-based official newspaper Guangming Daily last month.

The power wall stems from a fundamental contradiction – while binary systems are efficient at carrying information, they consume a large amount of power. The architecture wall is caused by the fact that new non-silicon chips cannot easily communicate with traditional systems based on CMOS or complementary metal-oxide-semiconductors.

Li’s team had been exploring alternatives since 2022. Their breakthrough came with the proposal of a new numerical system – Hybrid Stochastic Number (HSN) – which combines traditional binary numbers with stochastic or probability-based numbers.

Binary logic, the foundation of today’s computing, represents variables using 0s and 1s and relies on precise arithmetic operations. However, large-scale binary computations require extensive hardware resources.

In contrast, probabilistic computing leverages the frequency of “high-level” voltage signals over a fixed time to represent values, significantly reducing hardware consumption. It has already been used in fields like image processing, neural networks and deep learning. But probabilistic computing also suffers from long computation delays due to its frequency-based representation of values.

To solve this, Li’s team introduced hybrid probabilistic logic, which combines the speed of binary computation with the efficiency of stochastic logic.

Based on this concept, the team designed a smart chip for touch and display in 2023 using leading Chinese chipmaker Semiconductor Manufacturing International Corporation’s mature 110-nanometre process technology.

The project results were published in the IEEE Journal of Solid-State Circuits two years ago. The team followed up with a high-efficiency multiplier chip for machine learning, which they fabricated using a standard 28nm CMOS process, according to results published in the Microelectronics Journal in January this year.

According to Guangming Daily, the research marks the first unification of binary, traditional stochastic and hybrid stochastic number systems, offering mathematical representations of each and analysing their characteristics in terms of fault tolerance, interference resistance and energy efficiency.

This provides a strong theoretical foundation for future hybrid probabilistic chip development.

In addition to HSN, the chip incorporates in-memory computing algorithms, which minimise the energy-intensive data shuttling between memory and processors in conventional architectures, thus improving overall efficiency.

It also features a system-on-chip (SoC) design, integrating various types of computing units to handle multiple tasks in parallel, breaking free from the constraints of traditional homogeneous architectures.

The chip is being applied in intelligent control scenarios, including touch recognition, where it filters out noise to detect weak signals and enhance user interaction.

It is also used in instrument displays, where it enables precise, low-power data processing to improve performance and reliability, and flight control systems, where it provides robust computing support for accurate and stable aircraft navigation.

Li told Guangming Daily that the team was working on a dedicated instruction set architecture (ISA) and microarchitecture tailored for hybrid probabilistic computing. They aim to extend the chip’s capabilities to speech and image processing, artificial intelligence large model acceleration, and other complex computing tasks.

“The current chip already achieves on-chip computing latency at the microsecond level, striking a balance between high-performance hardware acceleration and flexible software programmability,” Li said.

Không có file đính kèm.

Nguồn tham khảo

102

AI chips-hardware-compute 2025-06-09 21:10:16

Cổ phiếu Nvidia tăng 1.000 tỷ USD chỉ sau 2 tháng, vượt qua khủng hoảng từ “bóng ma DeepSeek”

Nvidia đã tăng thêm 1.000 tỷ USD giá trị thị trường chỉ trong 2 tháng, vượt qua cú sụt giảm nghiêm trọng do ảnh hưởng từ “bóng ma DeepSeek” đến từ Trung Quốc hồi tháng 1/2025.
Trong cú sốc DeepSeek, Nvidia mất tới 596 tỷ USD chỉ trong một ngày, nhiều hơn giá trị của 485 cổ phiếu trong S&P 500 và lớn gấp 200% so với thiệt hại lớn thứ hai là Broadcom (194 tỷ USD).
Sự phục hồi này đến từ kỳ vọng cao vào nhu cầu chip AI, đặc biệt từ các khách hàng chiến lược như Microsoft, Meta, Alphabet và Amazon, chiếm hơn 40% doanh thu của Nvidia.
Các công ty lớn này dự kiến sẽ chi 330 tỷ USD cho hạ tầng AI trong năm 2026, tăng 6% so với năm nay, theo ước tính từ Bloomberg.
Sau khi rơi vào đáy vào tháng 4/2025 vì lo ngại từ chính sách thương mại của Trump và cắt giảm đầu tư AI, cổ phiếu Nvidia đã tăng trở lại hơn 45%, đưa giá trị thị trường lên 3.4 nghìn tỷ USD, chỉ sau Microsoft.
Hiện cổ phiếu Nvidia được định giá gấp 29 lần lợi nhuận dự kiến, thấp hơn mức trung bình 10 năm là 34 lần. Tỷ lệ PEG dưới 0.9 – thấp nhất trong nhóm “Magnificent Seven”.
Nvidia vẫn có 13% doanh thu quý 1 từ Trung Quốc, nhưng công ty đã mở rộng quan hệ với chính phủ Trung Đông và có danh mục sản phẩm mạnh để giảm thiểu rủi ro.
Dù triển vọng khả quan, chỉ 74% các quỹ đầu tư dài hạn nắm giữ cổ phiếu Nvidia, thấp hơn Amazon, Apple và Microsoft – cho thấy còn dư địa tăng thêm.
Trong số 78 nhà phân tích, chỉ 1 người khuyến nghị bán, còn lại đánh giá tích cực với giá mục tiêu trung bình là 170 USD/cổ phiếu, tăng khoảng 24%.

📌 Nvidia tăng 1.000 tỷ USD giá trị sau cú sập lịch sử do DeepSeek Trung Quốc, phục hồi mạnh nhờ nhu cầu AI từ các ông lớn công nghệ. Với mức tăng 45% từ tháng 4 và định giá hấp dẫn (PEG < 0.9), Nvidia đang trên đà trở thành công ty dẫn đầu AI toàn cầu, dù vẫn còn dư địa đầu tư lớn từ các quỹ dài hạn.

https://timesofindia.indiatimes.com/technology/tech-news/nvidia-leaves-chinas-deepseek-ghost-behind-with-1-trillion-rally-reason-includes-microsoft-meta-google-and-amazon/articleshow/121727891.cms

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute AI market 2025-06-04 06:12:51

Vì sao Nvidia không thể rời bỏ Trung Quốc dù bị cấm bán chip AI?

Nvidia không thể rời bỏ thị trường Trung Quốc vì đây là nền kinh tế lớn thứ hai thế giới, chiếm khoảng 14% doanh thu của hãng trong năm tài chính gần nhất, tương đương 17,1 tỷ USD.
Thị trường AI Trung Quốc dự kiến đạt giá trị 50 tỷ USD trong 2-3 năm tới, là cơ hội tăng trưởng lớn mà Nvidia khó có thể bỏ qua nếu muốn đạt mục tiêu doanh thu 200 tỷ USD năm 2025 và 300 tỷ USD năm 2028.
Lệnh cấm xuất khẩu chip H20 sang Trung Quốc khiến Nvidia mất khoảng 2,5 tỷ USD doanh thu trong quý kết thúc tháng 4/2025 và dự kiến mất thêm 8 tỷ USD trong quý tiếp theo, do chip H20 chỉ thiết kế riêng cho thị trường này.
CEO Jensen Huang nhấn mạnh Trung Quốc có tới 50% nhà phát triển AI toàn cầu, nếu Nvidia bị loại khỏi thị trường này, các tài năng AI sẽ chuyển sang sử dụng nền tảng đối thủ, đe dọa vị thế dẫn đầu của Mỹ trong ngành AI.
Nvidia đang phát triển chip mới cho Trung Quốc nhằm đáp ứng quy định xuất khẩu của Mỹ, nhưng chưa có sản phẩm sẵn sàng và dự báo doanh thu chip mới khó bù đắp hoàn toàn khoản mất mát từ H20.
Việc Mỹ siết chặt kiểm soát xuất khẩu chip AI sang Trung Quốc đã thúc đẩy các công ty nội địa như Huawei tăng tốc phát triển chip AI, nâng tỷ lệ tự cung ứng chip AI của Trung Quốc từ 34% hiện nay lên 82% vào năm 2027.
Nếu Nvidia không duy trì hiện diện, các đối thủ nội địa sẽ chiếm lĩnh thị trường, và Trung Quốc sẽ đẩy mạnh phát triển công nghệ tự chủ, giảm phụ thuộc vào Mỹ.
Nvidia lập luận rằng việc bán chip AI cho Trung Quốc không chỉ mang lại doanh thu mà còn đóng góp thuế, tạo hàng nghìn việc làm tại Mỹ. Nếu bị loại khỏi thị trường này, Mỹ sẽ mất đi lợi thế cạnh tranh công nghệ dài hạn.
Chính quyền Mỹ vẫn duy trì các hạn chế xuất khẩu với lý do an ninh quốc gia, khiến Nvidia phải liên tục điều chỉnh sản phẩm, chiến lược và vận động hành lang để tìm kiếm cơ hội trở lại thị trường Trung Quốc.
Dù doanh thu toàn cầu của Nvidia vẫn tăng mạnh nhờ nhu cầu AI tại Mỹ, châu Âu, Trung Đông, nhưng sự vắng mặt tại Trung Quốc sẽ giới hạn tiềm năng tăng trưởng dài hạn và tạo điều kiện cho các đối thủ nội địa vươn lên.

📌 Nvidia không thể bỏ thị trường Trung Quốc vì đây là thị trường AI trị giá 50 tỷ USD, chiếm 14% doanh thu và là nơi tập trung 50% nhà phát triển AI toàn cầu. Nếu rút lui, Nvidia sẽ mất lợi thế cạnh tranh, doanh thu và tạo điều kiện cho các đối thủ nội địa như Huawei vươn lên mạnh mẽ.

https://www.wsj.com/tech/ai/why-nvidia-cant-just-quit-china-18e494f0

#WSJ

Why Nvidia Can’t Just Quit China

Despite booming demand elsewhere, growth would still be hindered without world’s second-largest economy

Dan Gallagher

June 2, 2025 5:30 am ET

Nvidia CEO Jensen Huang at a news conference in Taipei last month. Photo: i-hwa cheng/Agence France-Presse/Getty Images

Given all the trouble Nvidia NVDA -2.92%decrease; red down pointing triangle has selling its artificial-intelligence chips in China, one might wonder why the company even bothers trying anymore.

The answer is: It can’t really afford not to.

Nvidia used its fiscal first-quarter report last week to send a rather stark message to the Trump administration about the dangers of shutting American chip companies out of the Chinese artificial-intelligence market. “China’s AI moves on with or without U.S. chips,” Nvidia Chief Executive Jensen Huang said on the company’s conference call. Making the point that half the world’s AI developers are in China, Huang argued that preventing U.S. companies from competing there could ultimately cost America its leading position in the global AI industry.

“In the end, the platform that wins the AI developers wins AI,” Huang said. “Export controls should strengthen U.S. platforms, not drive half of the world’s AI talent to rivals.”

Nvidia also has powerful financial reasons to make that argument. The U.S. government’s decision in April to stop the company from selling its H20 chips to the Chinese market cost the company about $2.5 billion in lost sales in the April-ended quarter and will cost another $8 billion in the current period ending in July. That is because the H20 chip was designed specifically for the Chinese market to comply with then-current export restrictions, so it isn’t really salable anywhere else.

Demand for Nvidia’s AI chips is still booming in the rest of the world, so the lost China sales don’t hurt much in the near term. But Nvidia is now valued at around $3.3 trillion—triple the market cap of the next-largest chip company—precisely because investors think it still has a long runway of significant growth ahead. Wall Street analysts expect Nvidia’s annual revenue to cross the $200 billion mark this year and hit $300 billion by 2028, according to consensus estimates from FactSet.

That is unlikely to happen without China. The world’s second-largest economy is pursuing AI development with a passion. Venture funds backed by the Chinese government invested $184 billion into AI startups between 2000 and 2023, according to a Morgan Stanley report last month. Nvidia estimates the total addressable market in China for AI accelerators—the primary chips used in artificial-intelligence computing—to be around $50 billion.

“China is a quarter of the market. It’s a big number,” UBS analyst Tim Arcuri said in an interview. He added that Nvidia would have a “dominant hold” on that market if it were able to compete there.

Wall Street analysts haven’t given up on Nvidia getting back into the Chinese AI market. “We remain convinced that there will be at least some recovery of the China opportunity,” Joe Moore of Morgan Stanley wrote following Nvidia’s latest earnings report.

But a change at this point would require the Trump administration to either backtrack or seriously modify current rules that place sharp limits on the computing ability of chips sold into China. And that seems unlikely—at least given the most recent developments. On Friday for instance, President Trump accused China of violating its recent trade deal with the U.S., threatening a rebound in tensions.

Arcuri of UBS thinks modifications that allow more powerful chips to be sold could still comport with the administration’s aims, since restrictions on advanced chipmaking gear still limit China’s abilities to actually produce the most advanced processors. “If those equipment restrictions don’t change, there is this inherent ceiling to what they [China] can do,” Arcuri said.

SHARE YOUR THOUGHTS

What is your outlook on Nvidia in light of the Trump administration’s restrictions on trade with China? Join the conversation below.

Nvidia’s absence from the Chinese AI market is giving local competitors such as Huawei a leg up. Morgan Stanley estimates that China is able to supply about 34% of its AI chip needs now with local suppliers, with that “self-sufficiency ratio” reaching 82% in 2027. And if Nvidia does make it back into the market, it will still have to contend with the Chinese government’s ambitions to have homegrown tech at the heart of all its key industries.

Nvidia is considered years ahead of any of its rivals now. And its growing ecosystem of chips, full systems and software tools for AI developers would still be a major draw for Chinese companies looking to stay competitive in AI globally. Nvidia needs to get back into China. But the road there runs straight through the White House.

Write to Dan Gallagher at [email protected]

Không có file đính kèm.

Nguồn tham khảo

STI AI chips-hardware-compute 2025-06-04 05:59:07

Mỹ thất bại trong cuộc đua công nghệ với Trung Quốc: AI, chip, EV, drone Trung Quốc vượt mặt Mỹ

Mỹ đã áp dụng nhiều biện pháp để ngăn chặn sự phát triển công nghệ của Trung Quốc trong các lĩnh vực như AI, năng lượng, xe điện, drone và chip, nhưng các nỗ lực này chưa mang lại hiệu quả rõ rệt.
Xe điện của Trung Quốc rẻ hơn và nhiều tiêu chí vượt trội hơn xe Mỹ. Trung Quốc chiếm ưu thế tuyệt đối về drone dân dụng, xe tự lái đã xuất hiện phổ biến tại Vũ Hán, Bắc Kinh với tốc độ mà Waymo và Tesla chưa đạt được.
Trung Quốc sản xuất phần lớn pin và tấm pin mặt trời trên toàn cầu. Mỹ và đồng minh chỉ còn lợi thế nhỏ về chip và AI, nhưng khoảng cách này đang thu hẹp nhanh chóng.
Chính sách cấm xuất khẩu chip AI tiên tiến sang Trung Quốc bị nhiều chuyên gia và lãnh đạo như CEO Nvidia Jensen Huang chỉ trích vì thúc đẩy Trung Quốc phát triển hệ sinh thái công nghệ riêng, làm yếu vị thế Mỹ.
Trung Quốc chuyển sang dùng chip tự thiết kế, sản xuất nội địa như Huawei, Cambricon, CXMT, SMIC. Chip Ascend 910C của Huawei chỉ bằng 1/3 sức mạnh Nvidia nhưng số lượng chip trên mỗi siêu máy tính CloudMatrix 384 lại gấp 5 lần, tổng sức mạnh và dung lượng bộ nhớ vượt Nvidia, dù tiêu thụ điện gấp 4 lần.
SMIC đã trở thành nhà sản xuất chip lớn thứ ba thế giới, tiếp tục đổi mới dù chỉ có công nghệ cũ trước lệnh cấm.
Các biện pháp kiểm soát xuất khẩu bắt đầu từ nhiệm kỳ đầu của Trump, khi Mỹ cắt ZTE khỏi công nghệ Mỹ, sau đó là Huawei. Điều này buộc doanh nghiệp Trung Quốc phải đầu tư mạnh vào tự chủ công nghệ.
Trung Quốc sở hữu dân số lớn, lực lượng lao động kỹ thuật và kỹ sư AI chiếm tới một nửa toàn cầu. Thị trường nội địa khổng lồ giúp doanh nghiệp phát triển trước khi vươn ra quốc tế.
Đảng Cộng sản Trung Quốc kiên trì thúc đẩy tự chủ, giảm dần phụ thuộc nước ngoài, từ linh kiện nhỏ nhất đến tàu vận tải lớn nhất.
Giới chuyên gia nhận định Trung Quốc có thể tự cung ứng toàn bộ chuỗi công nghệ, thậm chí vượt qua cả TSMC (Đài Loan) và Intel (Mỹ) trong tương lai gần.

📌 Mỹ thất bại trong việc kìm hãm công nghệ Trung Quốc: EV, drone, AI, chip, pin của Trung Quốc ngày càng vượt trội. Chính sách kiểm soát xuất khẩu của Mỹ đang thúc đẩy Trung Quốc tự chủ và đổi mới mạnh mẽ, đe dọa vị thế dẫn đầu công nghệ của Mỹ.

https://www.wsj.com/livecoverage/stock-market-today-trump-tariffs-trade-war-06-02-2025/card/the-great-debate-over-china-and-technology-KA4CQIOhkJzdWIt77G37

#WSJ

The U.S. Plan to Hobble China Tech Isn’t Working

Chinese solar panels, electric vehicles and drones are better than those made in the U.S. Is AI next?

Christopher Mims

May 30, 2025 9:00 pm ET

The U.S. has tried almost everything to win the tech race against China—across areas as varied as AI, energy, autonomous vehicles, drones and EVs. So far, none of it has worked.

China’s EVs are cheaper and by many measures better than America’s. The country dominates in consumer drones. Autonomous vehicles have rolled out on the streets of Wuhan and Beijing at a pace that Waymo and Tesla have yet to match. China produces the lion’s share of the world’s solar panels and batteries. And while the U.S. and its allies maintain a narrow lead in advanced microchips and AI, the gap appears to be closing faster than ever.

The result is a fierce debate between senior leaders in the current administration, and critics outside it. White House officials and their proxies are almost uniformly in favor of choking off China’s tech advance by banning the export of AI microchips and the tools to make them. Some outside the administration—including the head of Nvidia NVDA -2.92%decrease; red down pointing triangle—say such policies are backfiring by accelerating China’s development of its own tech ecosystem.

The debate comes down to this: Is it better to have China dependent on U.S. tech, or is the national security risk of China having our tech just too great?

Chips ahoy

Among those ramping up criticism of current export controls is Jensen Huang, chief executive of U.S. chip colossus Nvidia. China could spend $50 billion on chips and servers for AI in 2026, he said, and his company would miss out on that market as a result of a new ban on advanced AI chip exports to China.

On Wednesday, during an earnings call, Huang doubled down on his criticism, saying “Shielding Chinese chip makers from U.S. competition only strengthens them abroad and weakens America’s position. Export restrictions have spurred China’s innovation and scale.” So far, Nvidia’s restricted access to China has done little to dent its revenues.

In the absence of chips from the U.S., China is turning to chips designed and manufactured entirely by Chinese companies, including Huawei, Cambricon, CXMT and Semiconductor Manufacturing International Corporation.

The Alibaba Zhejiang Cloud Computing Renhe Data Center in Hangzhou, in Zhejiang province, China, is the city’s first super data center. Chinese electric vehicle maker Baidu's Apollo RT6 robotaxi drives in Wuhan, China.Cfoto/DDP/ZUMA Press, Bloomberg News

Each of Huawei’s latest Ascend 910C AI chips are only one-third as powerful as Nvidia’s, but five times as many are crammed into each of the company’s CloudMatrix 384 AI supercomputers. In terms of raw power, and in the all-important metric of how much memory is crammed into each CloudMatrix computer, Huawei is already beating Nvidia.

And though Huawei’s CloudMatrix 384 requires four times as much electricity, China has a huge advantage in terms of energy production, says Doug O’Laughlin, an analyst at SemiAnalysis who has studied Huawei’s new AI supercomputers. “China has been adding energy production for the past 10 years, and has the entire supply chain on lock to continue to do that,” he adds.

SMIC, which makes Huawei’s processors, is now the third-biggest chip maker in the world, and has managed to innovate in the manufacture of high-quality chips despite having older-generation, pre-export-ban tech.

Bryan Burack, a China analyst at the Heritage Foundation, the conservative DC think tank with significant influence in the current administration, says export controls on tech like AI are more important than ever because the U.S. is in a new Cold War. Burack was a member of the National Security Council until last week, when 100 staffers were cut, and says his time on the council strengthened his convictions on the matter.

“Are we comfortable helping China create dual-use AI that can be used to acquire targets for guided weapons,” Burack says, “even if it’s a sound business?”

Over and over again, China has purchased advanced tech from the U.S. and copied it, then scaled it into huge businesses, a process O’Laughlin likens to a student copying another’s homework. “I sound almost antibusiness saying this, but I really can’t express enough that we shouldn’t make their jobs easier,” he adds.

Trump’s first term

Concerns about China’s progress in tech are hardly new in Washington, but the push to hamper its development kicked into high gear during President Trump’s first administration, according to industry insiders.

In 2018, then-commerce secretary Wilbur Ross cut off Chinese telecom company ZTE from U.S. tech, such as microchips, over national-security concerns. This effectively ended the global ambitions of the Chinese government-connected company.

“At a stroke, the U.S. government demonstrated to China’s government and China’s tech companies that it had an at-will ability to kneecap China’s tech leaders,” says Dan Wang, a research fellow at the Hoover Institution at Stanford University.

A string of restrictions on microchips and software followed, notably for Chinese smartphone and telecom giant Huawei. At that time, even Chinese tech companies were unwilling to buy domestically made chips because they were inferior to American-designed chips manufactured in the U.S., South Korea and Taiwan, says Rui Ma, a Silicon Valley-based angel investor and China-tech analyst. With no other option, China’s tech companies were forced to buy local.

This kicked off huge investments by China’s tech companies and its government. The better China’s chips got, the more the U.S. attempted to slow down China’s advance, including by banning the export of chipmaking machinery and materials to China.

A Kirin 9000s chip fabricated in China by Semiconductor Manufacturing International Corp. being removed from inside a Huawei smartphone. Shoppers at a Huawei store in Shanghai.James Park/Bloomberg News, HECTOR RETAMAL/AFP/Getty Images

This doesn’t mean China’s domestic chipmaking ecosystem is equal to what can be marshaled by the U.S. and its allies. But the idea that it is far behind—or will remain so forever—flies in the face of history, says Patrick Moorhead, a semiconductor-industry analyst who was an executive at AMD for 11 years.

“I’ve been in tech for 30 years, and I’ve heard a lot of, ‘Oh, China won’t figure this out,’” he adds. “Now I think the only question is when they will figure it out.” In the long run, China could be in a position to locally source everything it needs to match or even exceed the capabilities of companies like Taiwan’s TSMC and U.S.-based Intel, he says.

Why China?

The experts I spoke with pointed out that China has a unique combination of assets that no other country in the history of America’s trade wars has possessed.

Its gigantic population is exceptionally well-trained, from skilled factory workers to engineers educated in the country’s universities. Nvidia’s Huang has said repeatedly that half of the world’s AI engineers are in China. Nvidia recently came under fire from U.S. senators for building a new engineering office in Shanghai.

It also has a huge domestic market, so it can incubate companies within its borders before they go global. And while China is dependent on the U.S. and the rest of the world for many raw materials and specialized goods, the Chinese Communist Party’s well-organized, well-funded and consistent push for self-sufficiency means those dependencies are shrinking. Year after year, the country produces a greater proportion of everything it needs, from the tiniest chip components to the biggest cargo ships.

In the best of all worlds, the U.S. would have allowed its chip and software champions to continue dominating the domestic Chinese market, says Wang. But since export controls initiated years ago have made that impossible, the only logical way forward may be to keep up the controls—and probably even tighten them.

“What we have now is not the second-best solution, but a seventh-best solution,” says Wang. “There’s certainly no way to restore trust with Chinese companies.”

Write to Christopher Mims at [email protected]

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute AI pháp lý-quản trị-chủ quyền 2025-06-03 05:34:10

Nvidia phản công Huawei: tung chip B30 siêu mạnh cho Trung Quốc, sản xuất hơn 1 triệu chiếc năm 2025

Nvidia đang phát triển chip AI B30 mới dành riêng cho thị trường Trung Quốc nhằm tuân thủ các quy định xuất khẩu từ Mỹ và duy trì thị phần tại nền kinh tế lớn thứ hai thế giới.
Theo trang The Information, B30 sẽ có khả năng liên kết nhiều đơn vị để tạo cụm máy tính hiệu năng cao (HPC clusters), cho phép khai thác sức mạnh tương tự các hệ thống như NVL72.
Công ty dự kiến sản xuất hơn 1 triệu đơn vị chip B30 trong năm 2025, cho thấy mức độ đầu tư lớn để duy trì vị thế trước sức ép ngày càng tăng từ Huawei và các hãng Trung Quốc.
Dòng chip này được cho là dựa trên nền tảng Blackwell, nền tảng GPU thế hệ mới nhất mà Nvidia công bố năm ngoái.
CEO Jensen Huang xác nhận đang “cân nhắc” phát triển chip cho Trung Quốc trong buổi họp cổ đông, tuy chưa công bố chi tiết vào thời điểm đó.
Hành động này diễn ra sau khi chính phủ Mỹ áp dụng lệnh cấm xuất khẩu H20, dòng chip AI từng được thiết kế riêng cho thị trường Trung Quốc, khiến Nvidia mất khoảng 8 tỷ USD doanh thu quý II và 4,5 tỷ USD tồn kho quý I.
Mỹ thông báo ngày 9/4 rằng H20 sẽ cần giấy phép xuất khẩu và đến ngày 14/4, xác nhận các quy định này sẽ được duy trì vô thời hạn, khiến Nvidia buộc phải chuyển hướng.
Jensen Huang nhiều lần nhấn mạnh rằng Trung Quốc chiếm 14% doanh thu toàn cầu của Nvidia năm ngoái, và nếu các hạn chế tiếp tục, điều đó có thể giúp Huawei vươn lên mạnh mẽ.
Huawei hiện đang mở rộng kiến trúc tính toán hiệu năng cao Supernode 384 dựa trên chip AI Ascend, được xem là đối trọng với NVL72 của Nvidia trong việc giảm nghẽn cổ chai tại trung tâm dữ liệu.
Trong cuộc phỏng vấn gần đây, Jensen Huang chỉ trích việc Mỹ cố cắt đứt AI Trung Quốc là “thiếu hiểu biết”, và cảnh báo điều này sẽ thúc đẩy Trung Quốc xây dựng hệ sinh thái độc lập không có Mỹ.
Chính quyền Mỹ gần đây còn tuyên bố việc sử dụng chip Huawei Ascend ở bất kỳ đâu trên thế giới đều vi phạm lệnh kiểm soát xuất khẩu, cho thấy sự lo ngại ngày càng lớn về sức mạnh công nghệ của Trung Quốc.

📌 Để tránh mất thị phần vào tay Huawei, Nvidia sẽ tung ra chip AI B30 dành riêng cho Trung Quốc, có khả năng kết nối cụm siêu máy tính, dự kiến sản xuất trên 1 triệu chip trong năm 2025. Việc này phản ánh nỗ lực duy trì vị thế tại thị trường chiếm 14% doanh thu Nvidia, bất chấp các lệnh cấm từ Mỹ đang khiến hãng chịu thiệt hại hàng tỷ USD và tạo cơ hội lớn cho Huawei tăng tốc.

https://www.scmp.com/tech/big-tech/article/3312779/nvidia-builds-new-ai-chip-china-powerful-computing-cluster-capabilities-report

Nvidia builds new AI chip for China with powerful computing cluster capabilities: report

Company plans to produce more than 1 million units of its new China-tailored B30 chip this year, according to The Information

Reading Time:2 minutes

Xinmei Shen

Published: 8:00pm, 2 Jun 2025

Semiconductor giant Nvidia is developing a new China-tailored artificial intelligence (AI) chip that complies with US export regulations and will enable users to link multiple units to create high-performance computing clusters, according to a report by digital publication The Information.

Nvidia plans to produce more than 1 million units of its new B30 chip this year, the report said, amid efforts by the company to preserve its market share in the world’s second-largest economy in the face of Washington’s tightened tech restrictions.

Santa Clara, California-based Nvidia did not immediately respond to a request for comment on Monday.

During the company’s quarterly earnings call last week, Nvidia founder, president and chief executive Jensen Huang said the company was “considering” a new AI chip for the Chinese market, but did not have any details to announce at the time.

Nvidia is expected to introduce its new China-tailored graphics processing unit (GPU) in July, according to a Jefferies research note on Monday. It said the AI chip would likely be based on the company’s Blackwell platform, which was introduced last year.

Speculation on Nvidia’s potential new GPU for China has intensified since the company revealed in mid-April new US export controls on its H20 chips, which were designed for Chinese customers. Nvidia said it would take US$5.5 billion in charges under that measure.

Nvidia said it was informed by the US government on April 9 that the H20 chip would require a licence to be exported to China. On April 14, Washington told Nvidia that these rules would be in place indefinitely. It is unclear how many, if any, of those licences the US government might grant.

For the second quarter, the company projected US$8 billion in revenue loss from the H20 chips ban. It had already incurred a US$4.5 billion charge in the first quarter owing to excess inventory and purchase obligations for H20.

To comply with Washington’s export controls, Nvidia had been designing chips that would come as close as possible to US limits and make them legal to sell in China.

Huang has repeatedly stressed Nvidia’s commitment to China, which accounted for 14 per cent of the company’s revenue last year, and warned that further restrictions on its products could boost the AI chip business of Huawei Technologies.

Huawei, which Huang last month called “one of the most formidable technology companies in the world”, has built AI chips with capabilities that are rapidly catching up with Nvidia’s.

In a recent interview with tech site Stratechery, Huang said US chip restrictions’ goal to cut off China’s ability to develop AI was “deeply uninformed”. He added that restricting American firms from competing in China would help the country build a “rich ecosystem” that excludes the US.

Huawei is already pushing for wider support of its Ascend AI processor-based, high-performance computing architecture – called Supernode 384 – that is touted as a rival to the structure used in Nvidia’s NVL72 system in alleviating bottlenecks for data centres.

The Trump administration last month issued new guidelines that defined the use of Huawei’s Ascend AI processors “anywhere in the world” as a violation of US export controls, which highlighted the chips’ growing competitiveness.

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute AI market 2025-06-03 05:25:01

CEO NVIDIA xác nhận Huawei đã phát triển cụm AI CloudMatrix mạnh ngang ngửa hệ thống Grace Blackwell

CEO Jensen Huang của NVIDIA xác nhận rằng Huawei đã phát triển hệ thống AI cluster mang tên CloudMatrix, với hiệu năng tương đương hoặc thậm chí vượt qua hệ thống mới nhất của NVIDIA là Grace Blackwell.
Đây là lần đầu tiên đại diện NVIDIA công khai đánh giá hiệu năng CloudMatrix, khẳng định rằng Huawei đã chính thức thu hẹp khoảng cách công nghệ AI với phương Tây.
CEO Jensen Huang khẳng định: “Họ đang tiến rất nhanh… và cụm CloudMatrix có thể mở rộng quy mô lớn hơn cả Grace Blackwell” – đây là dấu hiệu cho thấy Huawei không chỉ bắt kịp mà còn có tiềm năng vượt mặt trong tương lai gần.
Ngoài hệ thống CloudMatrix, chip AI Ascend 910C của Huawei cũng được xác nhận có khả năng cạnh tranh trực tiếp với NVIDIA H200, dòng chip cao cấp nhất trong kiến trúc Hopper.
Trước đây, các chuyên gia cho rằng Huawei chưa bắt kịp H100 – nhưng thực tế hiện tại là Huawei đang duy trì nhịp độ phát triển sản phẩm ngang với NVIDIA, khiến CEO Jensen lo ngại nghiêm trọng về khả năng cạnh tranh tại thị trường Trung Quốc.
Điều này diễn ra trong bối cảnh các lệnh hạn chế công nghệ từ Mỹ ngày càng siết chặt, buộc các công ty Trung Quốc như Huawei phải phát triển hệ sinh thái phần cứng AI nội địa.
Jensen Huang cảnh báo rằng nếu các lệnh cấm vẫn tiếp diễn, NVIDIA có thể bị loại khỏi thị trường AI Trung Quốc, nhường sân cho Huawei và các đối thủ nội địa khác.

📌 Với cụm AI CloudMatrix có quy mô vượt cả Grace Blackwell và chip Ascend 910C cạnh tranh ngang hàng với H200, Huawei đã khiến CEO NVIDIA Jensen Huang phải công khai thừa nhận sức mạnh vượt trội và tốc độ phát triển đáng gờm. Diễn biến này không chỉ đe dọa thị phần của NVIDIA tại Trung Quốc mà còn đánh dấu bước ngoặt khi công nghệ AI Trung Quốc tiến gần hơn bao giờ hết đến vị thế dẫn đầu toàn cầu.

https://wccftech.com/nvidia-ceo-confirms-huawei-cloudmatrix-ai-cluster-now-competes-with-grace-blackwell/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-05-31 17:53:23

Ngành công nghiệp bán dẫn Singapore ưu tiênAI và phát triển nhân tài hơn là lo ngại thuế quan

Tại sự kiện Semicon Southeast Asia 2025 tổ chức tại Singapore từ ngày 20 đến 22/5, các công ty bán dẫn hàng đầu đều khẳng định AI và nhân lực là hai ưu tiên hàng đầu, vượt qua lo ngại về chính sách thương mại và thuế quan.
Mặc dù phải đối mặt với bất ổn chuỗi cung ứng do căng thẳng Mỹ - Trung từ 2017, ngành bán dẫn toàn cầu vẫn đạt tăng trưởng mạnh, với doanh thu toàn cầu ước tính vượt 1.000 tỷ USD vào đầu những năm 2030, tăng từ 627 tỷ USD năm 2024.
AI thúc đẩy nhu cầu chip, nhưng đồng thời đặt ra thách thức về đổi mới công nghệ và phối hợp sản xuất toàn cầu giữa các công ty khác nhau.
GlobalFoundries ký kết hợp tác với A*Star để tiếp cận cơ sở R&D và nâng cao kỹ năng cho lực lượng lao động trong công nghệ đóng gói tiên tiến – giải pháp then chốt cho xử lý AI tiết kiệm năng lượng và tốc độ cao.
Đóng gói tiên tiến kết hợp nhiều chip vào một gói duy nhất, tối ưu hóa hiệu suất xử lý và tiêu thụ điện năng, đang là xu hướng nóng trong ngành.
Các công ty như Lam Research và Applied Materials tăng cường hợp tác với khách hàng, nhà cung ứng, và các trường đại học như NTU và NUS, nhằm phát triển R&D và giữ chân nhân tài.
Nhiều công ty đang tích cực tham gia hội chợ nghề nghiệp, mở rộng tìm kiếm nhân tài không chỉ từ kỹ sư mà còn từ ngành phần mềm và các lĩnh vực liên quan.
Chương trình SkillsFuture đang hỗ trợ các khóa học ngắn hạn cho sinh viên tốt nghiệp và người chuyển nghề, do Bộ Thương mại & Công nghệ và Chính phủ Singapore triển khai.
Dù có hỗ trợ từ chính phủ, nhiều doanh nghiệp SME vẫn cho rằng cần nỗ lực nhiều hơn để thay đổi cái nhìn của sinh viên về ngành chế tạo chip, vốn bị xem là “ít hấp dẫn”.

📌 Ngành bán dẫn Singapore đặt trọng tâm vào AI và nhân lực thay vì lo ngại về thuế quan. Doanh thu chip toàn cầu dự báo vượt 1.000 tỷ USD, thúc đẩy hợp tác sâu giữa các công ty và trường đại học. Đóng gói tiên tiến trở thành công nghệ trọng tâm, trong khi thiếu hụt nhân tài được xem là thách thức lớn nhất cần giải quyết trong kỷ nguyên AI.

https://www.hardwarezone.com.sg/tech-news-singapore-chipmaker-ai-talent-hunt-priority-tariff-downplay

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-05-28 05:12:07

Nvidia và các đối tác như Foxconn, Dell đã khắc phục sự cố kỹ thuật với hệ thống AI rack GB200

Nvidia và các đối tác như Foxconn, Inventec, Dell và Wistron đã khắc phục các vấn đề kỹ thuật của hệ thống rack AI GB200 sử dụng chip Blackwell và CPU Grace, mở đường cho việc giao hàng hàng loạt.
Các lỗi từng gây đình trệ bao gồm: kết nối chip, rò rỉ hệ thống làm mát bằng chất lỏng, quá nhiệt từ 72 GPU hiệu năng cao và lỗi phần mềm phức tạp.
Sau khi sửa lỗi vào khoảng 2–3 tháng trước, đối tác của Nvidia đã bắt đầu giao rack GB200 từ cuối quý I/2025 và hiện đang tăng công suất nhanh chóng.
Cấu hình GB200 gồm 36 Grace CPU và 72 Blackwell GPU kết nối qua hệ thống NVLink – tăng cường khả năng xử lý khối lượng lớn tác vụ AI tạo sinh và mô hình ngôn ngữ lớn.
Để đảm bảo chất lượng, các nhà cung cấp đã nâng cấp quy trình kiểm tra trước khi xuất hàng nhằm đảm bảo rack hoạt động ổn định với tác vụ AI.
Các quốc gia như Ả Rập Saudi và UAE đã tuyên bố mua hàng ngàn chip Blackwell, mở rộng thị trường Nvidia ngoài các công ty Big Tech như Microsoft hay Meta.
Nvidia dự kiến ra mắt hệ thống AI rack thế hệ tiếp theo – GB300 – vào quý III/2025. Hệ thống này hỗ trợ bộ nhớ mạnh hơn và tối ưu hóa cho các mô hình phức tạp như OpenAI’s 01 hay DeepSeek R1.
Tuy nhiên, Nvidia đã hoãn triển khai thiết kế bo mạch mới “Cordelia” cho GB300 do vấn đề lắp đặt, quay lại dùng thiết kế cũ “Bianca” như trên GB200 để tăng tốc sản xuất.
Thiết kế Cordelia, nếu triển khai, giúp dễ dàng thay GPU và cải thiện biên lợi nhuận nhưng sẽ được áp dụng ở thế hệ chip tiếp theo.
Nvidia cũng đang bù đắp doanh thu sụt giảm từ Trung Quốc do lệnh cấm xuất khẩu chip H20, dự kiến ghi nhận lỗ 5,5 tỷ USD từ hàng tồn kho và cam kết mua.
Biên lợi nhuận quý này có thể giảm từ 71% xuống 58%, nhưng tốc độ giao hàng GB200 cải thiện có thể giúp bù đắp một phần tổn thất trong nửa cuối năm.

📌 Nvidia đã giải quyết triệt để các lỗi kỹ thuật của hệ thống AI rack GB200 và bắt đầu tăng tốc giao hàng, tạo tiền đề cho doanh số quý đạt 43 tỷ USD, tăng 65% so với năm trước. Với GB300 sắp ra mắt trong quý 3 và sự tham gia của khách hàng quốc gia như UAE, Nvidia đang vượt qua cả rào cản kỹ thuật và chính trị để duy trì vị thế dẫn đầu trong lĩnh vực AI phần cứng.

https://www.ft.com/content/26ad4a47-aefd-4a96-9605-275027f83b53

#FT

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute AI pháp lý-quản trị-chủ quyền 2025-05-26 17:22:54

Tencent và Baidu tiết lộ chiến lược đối phó với lệnh cấm chip từ Mỹ để duy trì vị trí trong cuộc đua AI toàn cầu

Tencent và Baidu đang giữ vững vị thế trong cuộc đua AI toàn cầu bất chấp việc Mỹ siết chặt lệnh cấm xuất khẩu chip AI như GPU từ Nvidia và AMD.
Tencent xác nhận đã có "kho dự trữ mạnh" các GPU hiệu suất cao, giúp họ duy trì huấn luyện AI thêm nhiều thế hệ nữa.
Không chạy đua theo cách của các công ty Mỹ với cụm GPU khổng lồ, Tencent cho biết họ đạt hiệu quả cao ngay cả với số lượng chip hạn chế nhờ mô hình nhỏ gọn và tối ưu hóa phần mềm.
Tencent đang khám phá việc sử dụng chip tùy chỉnh nội địa, giảm phụ thuộc vào GPU nhập khẩu.
Baidu nhấn mạnh khả năng “full-stack” từ hạ tầng đám mây đến AI và ứng dụng như chatbot ERNIE, giúp họ duy trì hiệu quả dù thiếu chip tiên tiến.
Baidu cũng tự phát triển phần mềm để tối ưu hóa hiệu suất và giảm chi phí vận hành mô hình AI, nhờ vào việc sở hữu phần lớn công nghệ trong hệ sinh thái.
Cả hai công ty đều nhấn mạnh rằng sự phát triển chip AI nội địa tại Trung Quốc đang tiến bộ, tạo nền tảng cho đổi mới dài hạn.
Theo Gartner, Trung Quốc vẫn tụt hậu so với Mỹ về công nghệ bán dẫn AI, nhưng đã đạt tiến bộ đáng kể, từ vật liệu, thiết bị cho đến đóng gói chip.
CEO Nvidia, Jensen Huang, gọi lệnh cấm của Mỹ là "thất bại", cho rằng nó gây tổn hại cho các công ty Mỹ nhiều hơn là cản trở Trung Quốc.

📌 Tencent và Baidu đã thích ứng linh hoạt với lệnh cấm chip AI từ Mỹ bằng cách dự trữ GPU, sử dụng chip nội địa và tối ưu hóa phần mềm. Tencent cho biết kho chip hiện tại đủ dùng thêm vài thế hệ AI, trong khi Baidu tận dụng hệ sinh thái công nghệ sở hữu để giảm chi phí và duy trì hiệu quả. Sự phát triển chip AI trong nước đang giúp Trung Quốc giảm dần phụ thuộc vào Mỹ.

https://www.cnbc.com/2025/05/26/tencent-baidu-reveal-how-theyre-dealing-with-us-ai-chip-curbs.html

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute AI pháp lý-quản trị-chủ quyền 2025-05-25 08:42:43

Nvidia tung chip AI Blackwell giá rẻ cho Trung Quốc sau lệnh cấm, cắt giảm đến 45% giá bán

Nvidia đang chuẩn bị ra mắt chip AI thế hệ mới dựa trên kiến trúc Blackwell dành riêng cho thị trường Trung Quốc, với giá bán chỉ từ 6.500–8.000 USD, thấp hơn nhiều so với mẫu H20 từng bị cấm (10.000–12.000 USD).
Chip mới sẽ sử dụng bộ nhớ GDDR7 thay vì high-bandwidth memory (HBM), và không áp dụng công nghệ đóng gói CoWoS cao cấp từ TSMC, giúp đơn giản hóa sản xuất và hạ giá thành.
Sản xuất hàng loạt dự kiến bắt đầu vào tháng 6/2025, với một phiên bản khác dùng kiến trúc Blackwell cũng đang được phát triển, có thể ra mắt vào tháng 9/2025.
Đây là lần thứ ba Nvidia phải “tùy chỉnh” GPU cho thị trường Trung Quốc do các lệnh hạn chế xuất khẩu từ Mỹ, đặc biệt giới hạn mới về băng thông bộ nhớ ở mức 1,7–1,8 TB/giây.
H20 với băng thông 4 TB/giây đã bị cấm hoàn toàn. Chip mới được thiết kế giới hạn băng thông ở 1,7 TB/giây, nằm trong mức được phép.
Nvidia đã ghi nhận khoản xóa sổ tồn kho trị giá 5,5 tỷ USD và mất đi 15 tỷ USD doanh thu tiềm năng do lệnh cấm H20.
Tỷ lệ thị phần của Nvidia tại Trung Quốc đã giảm mạnh từ 95% (trước 2022) xuống chỉ còn 50%. Huawei – với chip Ascend 910B – đang chiếm lĩnh phần còn lại.
CEO Jensen Huang cảnh báo nếu các lệnh hạn chế tiếp tục, khách hàng Trung Quốc sẽ chuyển sang dùng chip Huawei.
Nvidia vẫn đang chờ phê duyệt chính thức từ chính phủ Mỹ để triển khai dòng sản phẩm mới, và xem đây là cơ hội “hạn chế” trong thị trường 50 tỷ USD data center tại Trung Quốc.

📌 Nvidia sẽ tung chip Blackwell giá rẻ (6.500–8.000 USD) cho Trung Quốc sau khi H20 bị cấm, nhằm duy trì chỗ đứng tại thị trường trị giá 50 tỷ USD. Chip mới dùng GDDR7, giới hạn băng thông ở 1,7 TB/giây để tuân thủ quy định Mỹ, nhưng Nvidia đã mất 45% thị phần và cảnh báo Huawei có thể tiếp tục vươn lên nếu hạn chế kéo dài.

https://www.cnbc.com/2025/05/24/nvidia-to-launch-cheaper-blackwell-ai-chip-for-china-reuters-says.html

Không có file đính kèm.

Nguồn tham khảo

OpenAI ChatGPT AI chips-hardware-compute 2025-05-24 06:11:20

OpenAI và UAE xây trung tâm dữ liệu AI lớn nhất thế giới tại Abu Dhabi

Ngày 23/5/2025, OpenAI công bố hợp tác với UAE để triển khai Stargate – nền tảng hạ tầng AI lần đầu tiên mở rộng ra quốc tế, tại Abu Dhabi.
Stargate Abu Dhabi sẽ là trung tâm dữ liệu AI lớn nhất thế giới, với cụm điện toán có công suất 1 gigawatt, trong đó 200MW sẽ vận hành vào năm 2026.
Dự án là một phần của kế hoạch lớn hơn trị giá 500 tỷ USD trong 4 năm tới nhằm xây dựng hạ tầng AI tại Mỹ và trên toàn cầu phục vụ AGI an toàn, bảo mật và mang lại lợi ích rộng rãi.
Các đối tác chính gồm: G42, Oracle, NVIDIA, Cisco, SoftBank.
Stargate UAE có bán kính cung cấp hạ tầng AI lên đến 2.000 dặm, phủ sóng đến một nửa dân số thế giới.
UAE sẽ trở thành quốc gia đầu tiên triển khai ChatGPT trên toàn quốc, mang công nghệ OpenAI đến với toàn bộ người dân.
Dự án nằm trong loạt thỏa thuận được ký kết trong chuyến công du Trung Đông của Tổng thống Mỹ Donald Trump tuần trước.
Stargate phản ánh tầm nhìn dài hạn của OpenAI trong việc xây dựng năng lực điện toán quy mô “frontier-scale” trên toàn cầu.
Dự án cũng phù hợp với cam kết đầu tư 1,4 nghìn tỷ USD của UAE vào Mỹ, góp phần tạo việc làm, thúc đẩy tăng trưởng kinh tế và giữ vững vị thế công nghệ của Mỹ.
OpenAI cho biết họ đã làm việc với nhiều quốc gia khác để mở rộng mô hình Stargate trong tương lai, thể hiện mục tiêu toàn cầu hóa hạ tầng AI.
Trước đó, OpenAI từng ủng hộ sáng kiến phát triển ứng dụng AI của Ấn Độ, cho thấy chiến lược mở rộng ảnh hưởng toàn cầu rõ rệt.

📌 OpenAI và UAE đang xây dựng trung tâm dữ liệu AI lớn nhất thế giới tại Abu Dhabi, với công suất 1 gigawatt và 200MW hoạt động từ 2026. Dự án trị giá 500 tỷ USD này nằm trong sáng kiến toàn cầu Stargate, đưa UAE trở thành quốc gia đầu tiên triển khai ChatGPT trên phạm vi toàn quốc và phủ sóng hạ tầng AI đến một nửa dân số thế giới. Đây là bước ngoặt chiến lược thể hiện tham vọng công nghệ toàn cầu của cả OpenAI và UAE.

https://www.ndtv.com/world-news/openai-uae-worlds-largest-ai-data-center-to-be-build-in-abu-dhabi-8486745

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-05-24 05:43:35

Mistral AI của Pháp hợp tác với G42 của UAE để phát triển hạ tầng AI toàn cầu

G42 (UAE) và Mistral AI (Pháp) ký kết hợp tác phát triển hạ tầng và nền tảng AI quy mô lớn, nhắm đến các khu vực Trung Đông, châu Âu và Global South (Nam bán cầu toàn cầu).
Hợp tác này nhằm đào tạo mô hình AI và xây dựng hệ thống theo đặc thù ngành, tạo ảnh hưởng vượt ra ngoài các trung tâm công nghệ truyền thống.
Hai bên sẽ quảng bá dịch vụ lẫn nhau tại thị trường hiện có và quốc tế, hướng đến mô hình phát triển AI mới “kết hợp chủ quyền và khả năng tương tác, tham vọng và trách nhiệm.”
Mistral AI sẽ hợp tác với Đại học Trí tuệ Nhân tạo Mohamed bin Zayed (MBZUAI) về R&D, phát triển nhân tài và ứng dụng thực tế, nhất là về tiết kiệm năng lượng và an toàn AI.
G42 đóng vai trò đầu tàu trong chiến lược AI quốc gia UAE, từng sáp nhập ba đơn vị G42 Cloud, Inception, và Injazat thành Core42 để đẩy mạnh giải pháp AI quy mô quốc gia.
Trước đó, MGX (UAE) cùng Nvidia và các công ty Pháp công bố kế hoạch xây dựng campus AI lớn nhất châu Âu. Đây là dấu hiệu cho thấy quan hệ AI chiến lược giữa UAE và Pháp.
Tổng thống UAE Sheikh Mohamed và Tổng thống Pháp Emmanuel Macron đã gặp mặt tại Paris vào tháng 2 để thảo luận đầu tư vào campus AI tại Pháp.
G42 đang mở rộng sang thị trường Mỹ, hợp tác với Cisco để phát triển hạ tầng AI trong khu vực công và tư.
G42 từng nhận đầu tư 1,5 tỷ USD từ Microsoft (4/2024) và hợp tác với OpenAI trong các lĩnh vực như tài chính, y tế, năng lượng.
G42 và Nvidia cũng phối hợp phát triển mô hình AI mô phỏng thời tiết và khí hậu toàn cầu thông qua nền tảng Earth-2.

📌 G42 (UAE) và Mistral AI (Pháp) thiết lập quan hệ chiến lược phát triển hạ tầng AI toàn cầu, tập trung tại Trung Đông, châu Âu và Global South. Thỏa thuận bao gồm hợp tác R&D, đào tạo nhân lực và ứng dụng AI thực tiễn, mở rộng ảnh hưởng ra ngoài các trung tâm công nghệ truyền thống. G42 đang dấn thân vào thị trường toàn cầu, được Microsoft đầu tư 1,5 tỷ USD và từng hợp tác với OpenAI và Nvidia.

https://www.thenationalnews.com/business/2025/05/20/abu-dhabis-g42-and-frances-mistral-ai-team-up-for-ai-infrastructure-development/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute AI pháp lý-quản trị-chủ quyền 2025-05-24 05:30:33

Trung Quốc phản ứng mạnh mẽ trước lệnh cấm chip AI mới của Mỹ

Trung Quốc phản ứng dữ dội với lệnh cấm chip mới của Mỹ, trong đó cấm toàn cầu sử dụng chip AI cao cấp do các công ty Trung Quốc sản xuất, đặc biệt là dòng Ascend 910 của Huawei.
Bắc Kinh đã kích hoạt luật chống trừng phạt, đe dọa xử lý các tổ chức/cá nhân thi hành lệnh cấm của Mỹ.
Lệnh cấm được công bố trong thời gian hai bên đang thực hiện "lệnh đình chiến 90 ngày" trong chiến tranh thương mại, khiến Trung Quốc đặc biệt phẫn nộ.
Các chuyên gia nhận định Bắc Kinh ngày càng tự tin rằng họ có thể chiến đấu lâu dài với Mỹ trong lĩnh vực công nghệ.
Trung Quốc cho rằng phản ứng mạnh mẽ là cần thiết để tránh việc Mỹ "lấn tới" từng bước.
Trung Quốc hiện tin rằng họ đủ sức chống đỡ nhờ các thành tựu công nghệ gần đây như mô hình AI của DeepSeek, phát triển mà không cần chip cao cấp từ Mỹ.
Bắc Kinh có thể trả đũa bằng cách hạn chế xuất khẩu khoáng sản chiến lược – lĩnh vực Mỹ phụ thuộc lớn.
Trung Quốc cũng đang khuyến khích kiện tụng pháp lý và tăng hợp tác với các nước như Hà Lan – nơi có công ty ASML chuyên sản xuất thiết bị chip.
Chi tiêu R&D của Trung Quốc tăng mạnh: từ 1.970 tỷ nhân dân tệ (270 tỷ USD) năm 2018 lên 3.610 tỷ nhân dân tệ (492 tỷ USD) năm 2024 (~2,68% GDP)
Trong quý I/2025, chính phủ Trung Quốc hoàn thuế hơn 424 tỷ nhân dân tệ (khoảng 58 tỷ USD) cho các công ty công nghệ nhằm khuyến khích nội địa hóa công nghệ.
Cuộc đối đầu đang lan sang các khu vực chiến lược như Trung Đông – nơi Mỹ đang vận động các đồng minh không sử dụng công nghệ Trung Quốc.
Trung Quốc có thể xoay sang các nước không liên kết như Malaysia và Việt Nam để vượt qua rào cản công nghệ của Mỹ.

📌 Trung Quốc đáp trả gay gắt lệnh cấm chip AI mới của Mỹ, thể hiện sự tự tin vào khả năng tự lực với chi tiêu R&D đạt 3.610 tỷ NDT (492 tỷ USD) và những đột phá như DeepSeek AI. Bắc Kinh có thể dùng luật chống trừng phạt, kiểm soát khoáng sản và thúc đẩy hợp tác với châu Âu để chống lại Mỹ trong cuộc chiến công nghệ đang leo thang.

https://www.scmp.com/economy/china-economy/article/3311594/why-china-fighting-so-hard-against-us-new-chip-ban-and-will-it-work

Tại sao Trung Quốc đấu tranh mạnh mẽ chống lại lệnh cấm chip mới của Mỹ – và liệu điều này có hiệu quả?

Phản ứng mạnh mẽ của Bắc Kinh đối với các biện pháp hạn chế mới của Mỹ về chip Trung Quốc xuất phát từ sự tự tin ngày càng tăng rằng họ có thể vượt qua Washington trong cuộc đối đầu này, các chuyên gia phân tích cho biết

Lệnh cấm của Mỹ đối với việc sử dụng chip vi xử lý tiên tiến của Trung Quốc trên phạm vi toàn cầu đặc biệt nhắm đến chip Ascend do tập đoàn công nghệ Huawei Technologies sản xuất. Ảnh: Reuters

Tác giả: Leopold Chen, Kandy Wong tại Hong Kong và Frank Chen tại Thượng Hải
Xuất bản: 21:00, 23 tháng 5 năm 2025

Những phản đối leo thang của Trung Quốc chống lại các hạn chế mới của Mỹ nhắm vào chip vi xử lý do Trung Quốc sản xuất là dấu hiệu cho thấy quyết tâm của Bắc Kinh không nhượng bộ thêm bất kỳ vị thế nào trong cuộc đối đầu với Washington về một loạt vấn đề công nghệ và thương mại, các nhà phân tích cho biết.

Mỹ tuần trước đã công bố lệnh cấm toàn cầu việc sử dụng chip được trang bị trí tuệ nhân tạo tiên tiến do các công ty Trung Quốc sản xuất – động thái mới nhất trong chuỗi các biện pháp hạn chế xuất khẩu nhắm vào ngành bán dẫn của Trung Quốc.

Nhưng khác với các trường hợp trước đây, khi Bắc Kinh thường phản ứng với sự kiềm chế tương đối, các cơ quan chức năng Trung Quốc đã đe dọa trừng phạt bất kỳ tổ chức hoặc cá nhân nào thực thi lệnh cấm mới của Washington bằng luật chống trừng phạt.

Việc Washington công bố chính sách mới trong khi hai bên đang ở giữa giai đoạn đình chiến 90 ngày trong cuộc chiến thương mại rõ ràng đã không được Bắc Kinh đón nhận tích cực, và điều này có thể một phần giải thích phản ứng mạnh mẽ của họ, các nhà phân tích nói với Post.

Động thái này cũng phản ánh sự tự tin ngày càng tăng của Trung Quốc về khả năng đối đầu trực tiếp với Washington về các vấn đề thương mại và công nghệ, với Bắc Kinh có thể nhằm mục đích buộc Washington "ít nhất phải lùi bước" về các quy định chip, họ bổ sung.

"Biện pháp trả đũa mạnh mẽ hơn của Trung Quốc sau Ngày Giải phóng có thể nhằm ngăn chặn việc tiếp tục phát triển theo kiểu 'cho 1 inch, lấy 1 dặm'", Lynn Song, nhà kinh tế trưởng khu vực Trung Hoa đại lục tại ngân hàng đầu tư ING, cho biết, đề cập đến ngày Tổng thống Mỹ Donald Trump phát động các mức thuế được gọi là "có đi có lại" vào ngày 2 tháng 4.

"Trung Quốc nhìn chung tự tin rằng họ sẽ thắng trong cuộc thử thách về sức bền nếu cần thiết."

Mỹ và Trung Quốc đạt thỏa thuận giảm thuế

Xung đột bắt nguồn từ thông báo tuần trước của Cục Công nghiệp và An ninh Mỹ rằng họ đã ban hành các quy định mới cấm việc sử dụng chip tiên tiến của Trung Quốc trên toàn cầu, với đề cập cụ thể đến dòng Ascend 910 của tập đoàn công nghệ Huawei Technologies.

Vào ngày 16 tháng 5, Bộ Ngoại giao Trung Quốc đã lên án lệnh cấm này là hành động đàn áp ác ý đối với ngành bán dẫn và trí tuệ nhân tạo của Trung Quốc. 5 ngày sau, Bộ Thương mại Trung Quốc đã đưa ra cảnh báo nghiêm khắc, cam kết sử dụng Luật Chống Trừng phạt Nước ngoài nếu lệnh cấm được thực thi.

"Các biện pháp đáp trả của Trung Quốc đối với việc hạn chế chip mới sẽ tác động đến các công ty công nghệ Mỹ có hoạt động kinh doanh lớn tại Trung Quốc", Tân Cường, giáo sư tại Viện Nghiên cứu Quốc tế thuộc Đại học Phục Đán ở Thượng Hải, cho biết. "Các công ty công nghệ này có tầm ảnh hưởng rất lớn tại Washington."

Trong khi lệnh cấm mới của Trump được một số chuyên gia ngành coi là mang tính chiến thuật và có mục tiêu, phản ứng của Bắc Kinh có thể phản ánh sự hiểu biết của các nhà lãnh đạo Trung Quốc về chiến thuật đàm phán của ông, Hứa Thiên Thần, nhà kinh tế cao cấp về Trung Quốc tại Đơn vị Tình báo Kinh tế, cho biết.

"Bắc Kinh về cơ bản đang theo dõi các động thái của Mỹ – bạn leo thang, tôi leo thang; bạn giảm leo thang, tôi giảm leo thang", ông nói.

Những đột phá công nghệ gần đây của Trung Quốc cũng giúp Bắc Kinh có thể có lập trường mạnh mẽ hơn, Tân cho biết.

"Nhiều bất ngờ công nghệ của Trung Quốc – từ chip của Huawei đến nền tảng AI DeepSeek – cũng đã khiến ban lãnh đạo cấp cao tự tin hơn rất nhiều rằng Trung Quốc vẫn có thể đổi mới bất chấp tất cả khó khăn do Mỹ áp đặt."

Đầu năm nay, startup Trung Quốc DeepSeek đã gây shock thế giới với việc phát hành mô hình AI tạo sinh tự phát triển có thể sánh ngang với nhiều sản phẩm tốt nhất của Thung lũng Silicon, bất chấp các biện pháp hạn chế xuất khẩu của Mỹ ngăn cản công ty tiếp cận chip AI tiên tiến.

Các nhà phân tích cho biết sự sẵn sàng của Trung Quốc trong việc đáp trả Mỹ có thể tạo tiền lệ cho các quốc gia khác đang đối phó với thuế quan của Washington, mặc dù ít chính phủ nào có đòn bẩy nhiều như Bắc Kinh.

"Việc các nước có thể làm như vậy hay không phụ thuộc vào khả năng gây tổn hại cho Mỹ của họ. Không nhiều quốc gia có đủ lá bài mặc cả", Hứa nói.

Trump có lịch sử nhắm vào Huawei. Trong nhiệm kỳ đầu tiên, chính quyền của ông đã cấm bán thiết bị internet di động 5G của công ty tại Mỹ và cấm Huawei mua công nghệ Mỹ.

Chính quyền Tổng thống Joe Biden sau đó đã áp dụng các biện pháp hạn chế rộng hơn đối với ngành công nghệ Trung Quốc với chiến lược "sân nhỏ, hàng rào cao".

Các hạn chế mới nhất của Mỹ có thể thúc đẩy Bắc Kinh tiếp tục đẩy nhanh nỗ lực đạt được sự tự lực trong các công nghệ cốt lõi chiến lược, các nhà phân tích cho biết.

"Về các lựa chọn của Trung Quốc, trong khi mối liên hệ công nghệ-thương mại đang sâu sắc hơn, họ có thể tăng gấp đôi sự tự lực, đặc biệt trong nghiên cứu và phát triển bán dẫn và năng lực AI trong nước", Joanne Lin, nghiên cứu viên cao cấp tại trung tâm nghiên cứu Viện ISEAS – Yusof Ishak ở Singapore, cho biết.

Chi tiêu nghiên cứu và phát triển của Trung Quốc đã tăng từ 1,97 nghìn tỷ nhân dân tệ (270 tỷ USD) năm 2018 lên 3,61 nghìn tỷ nhân dân tệ năm 2024, với chi tiêu tương đối so với tổng sản phẩm quốc nội cũng tăng từ 2,19% lên 2,68%.

Bắc Kinh cũng đã sử dụng các ưu đãi thuế để khuyến khích các công ty áp dụng công nghệ nội địa, với chính phủ khấu trừ hoặc hoàn thuế hơn 424 tỷ nhân dân tệ từ các công ty công nghệ trong quý đầu tiên của năm nay, dữ liệu chính thức cho thấy.

Ngoài ra, Bắc Kinh cũng có thể tận dụng nhiều hơn các kênh pháp lý để đẩy lùi các biện pháp hạn chế của Mỹ, chẳng hạn bằng cách khuyến khích các công ty Trung Quốc theo đuổi kiện tụng về lệnh cấm chip của Mỹ, Tân cho biết.

Một vũ khí khác mà Trung Quốc có thể sử dụng là khám phá hợp tác đa phương để đẩy lùi các hành động của Mỹ, các nhà phân tích cho biết.

Ngoại trưởng Trung Quốc Vương Nghị đã gặp người đồng cấp Hà Lan Caspar Veldkamp tại Bắc Kinh hôm thứ Năm, với 2 quan chức đồng ý duy trì liên lạc chặt chẽ về công nghệ bán dẫn.

Hà Lan là quê hương của một trong những nhà sản xuất thiết bị làm chip hàng đầu thế giới, ASML.

Trung Quốc cũng có thể thắt chặt kiểm soát xuất khẩu khoáng sản quan trọng để tăng áp lực lên Washington, theo Đinh Nhất Phàm, nghiên cứu viên cao cấp tại Đại học Nhân dân Trung Quốc ở Bắc Kinh.

"Nhiều doanh nghiệp công nghệ ở Mỹ phụ thuộc vào khoáng sản quan trọng nhập khẩu từ Trung Quốc. Nếu Trung Quốc kiểm soát xuất khẩu các khoáng sản này, Mỹ sẽ gặp khó khăn đáng kể trong việc phát triển công nghệ", Đinh nói.

Sự cạnh tranh công nghệ ngày càng tăng giữa 2 nền kinh tế lớn nhất thế giới cũng đang diễn ra ở các khu vực chiến lược như Trung Đông, với cả 2 bên đều tranh giành để tăng ảnh hưởng.

Chính quyền Trump mới đã sử dụng các cuộc đàm phán từng quốc gia để cố gắng cô lập Trung Quốc ở Trung Đông, James Downes, phó giáo sư quan hệ quốc tế tại Đại học Đô thị Hong Kong, cho biết.

"Trung Đông là chiến trường kinh tế quan trọng, bởi vì Mỹ đang thúc đẩy các đồng minh ở đó tránh công nghệ Trung Quốc, do đó sử dụng nó như một vùng đệm", ông nói.

Để đáp trả, Downes cho biết Trung Quốc có thể chuyển sang các nước không liên kết, có thể là Malaysia và Việt Nam, để vượt qua các biện pháp kiểm soát của Mỹ.

Why is China fighting so hard against the US’ new chip ban – and will it work?

Beijing’s strong reaction to new US curbs on Chinese chips stems from a growing confidence that it can outlast Washington in a stand-off, analysts say

Reading Time:4 minutes

Leopold Chen,Kandy Wongin Hong KongandFrank Chenin Shanghai

Published: 9:00pm, 23 May 2025

China’s escalating protests against new US restrictions targeting Chinese-made microchips are a sign of Beijing’s determination not to cede any more ground in its stand-off with Washington over a basket of tech and trade issues, analysts said.

The United States last week announced a global ban on the use of advanced artificial intelligence-powered chips made by Chinese companies – the latest in a string of export curbs targeting China’s semiconductor industry.

But unlike previous cases, where Beijing often reacted with relative restraint, Chinese authorities have threatened to punish any organisations or individuals who enforce Washington’s new ban using an anti-sanctions law.

The fact that Washington had announced the new policy while the two sides are midway through a 90-day truce in the trade war had “obviously” not been well received by Beijing, and that may partly explain its strong reaction, analysts told the Post.

The move also reflects China’s growing confidence in its ability to go toe-to-toe with Washington over trade and technology issues, with Beijing likely aiming to force Washington to “at least back down” over the chip rules, they added.

“China’s stronger retaliation post-Liberation Day may have been to prevent the ‘give them an inch and they’ll take a mile’ style of development from continuing,” said Lynn Song, chief Greater China economist at investment bank ING, referring to the day US President Donald Trump launched his so-called “reciprocal” tariffs, on April 2.

“China has generally been confident that it would win a test of endurance if need be.”

The conflict stems from the US Bureau of Industry and Security’s announcement last week that it had issued new rules banning the global use of advanced Chinese chips, with a specific reference to tech giant Huawei Technologies’ Ascend 910 series.

On May 16, China’s foreign ministry condemned the ban as a malicious suppression of China’s semiconductor and artificial intelligence industries. Five days later, the Chinese commerce ministry issued a stern warning vowing to use its Anti-Foreign Sanctions law if the ban was enforced.

“China’s countermeasures to the new chip curb will impact US tech firms with big business in China,” said Xin Qiang, a professor with Fudan University’s Institute of International Studies in Shanghai. “These tech firms have huge sway in Washington.”

While Trump’s new ban has been viewed as tactical and targeted by some industry experts, Beijing’s response likely reflected Chinese leaders’ understanding of his negotiation tactics, said Xu Tianchen, a senior China economist with the Economist Intelligence Unit.

“Beijing is essentially following US moves – you escalate, I escalate; you de-escalate, I de-escalate,” he said.

China’s recent technological breakthroughs also helped Beijing take a stronger line, Xin said.

“China’s many tech surprises – from Huawei’s chips to DeepSeek AI platforms – have also made the top leadership a lot more confident that China can still innovate against all the adversities imposed by the US.”

Earlier this year, Chinese start-up DeepSeek shocked the world with the release of a home-grown generative AI model that rivalled many of Silicon Valley’s best products, despite US export curbs preventing the company from access cutting-edge AI chips.

Analysts said China’s willingness to fight back against the US may set an example for other countries dealing with Washington’s tariffs, though few governments have as much leverage as Beijing.

“Whether countries can do so depends on their ability to inflict wounds on the US. Not many countries have enough bargaining chips,” Xu said.

Trump has a history of targeting Huawei. During his first term in office, his administration banned sales of the company’s 5G mobile internet equipment in the US and prohibited Huawei from procuring US technologies.

The administration of President Joe Biden later adopted wider curbs on China’s tech sector with its “small yard, high fence” strategy.

The latest US restrictions are likely to push Beijing to further accelerate its efforts to achieve self-reliance in strategic core technologies, analysts said.

“On China’s options, while the tech-trade nexus is deepening, it is likely to double down on self-reliance, particularly in semiconductor [research and development] and domestic AI capacity,” said Joanne Lin, a senior fellow at the ISEAS – Yusof Ishak Institute research centre in Singapore.

China’s expenditure on research and development has grown from 1.97 trillion yuan (US$270 billion) in 2018 to 3.61 trillion yuan in 2024, with its spending relative to gross domestic product also climbing from 2.19 per cent to 2.68 per cent.

Beijing has also been using tax incentives to encourage companies to adopt home-grown technologies, with the government deducting or refunding more than 424 billion yuan of taxes from tech companies during the first quarter of this year, official data showed.

Beyond this, Beijing could also make greater use of legal channels to push back against US curbs, such as by encouraging Chinese companies to pursue litigation over the US chip ban, Xin said.

Another weapon that China could employ is exploring multilateral cooperation to push back against US actions, analysts said.

Chinese foreign minister Wang Yi met his Dutch counterpart Caspar Veldkamp in Beijing on Thursday, with the two officials agreeing to maintain close communication regarding semiconductor technologies.

The Netherlands is home to one of the world’s leading makers of chipmaking equipment, ASML.

China could also tighten its export controls on critical minerals to up the pressure on Washington, according to Ding Yifan, a senior fellow at Renmin University of China in Beijing.

“Many technology enterprises in the US are reliant on the critical minerals imported from China. If China exerts controls on exports of these minerals, the US would encounter significant difficulties in advancing its technology,” Ding said.

The intensifying tech rivalry between the world’s two biggest economies is also playing out in strategic regions like the Middle East, with both sides scrambling to increase their influence.

The new Trump administration has been using country-by-country negotiations to try and isolate China in the Middle East, said James Downes, an assistant professor in international relations at Hong Kong Metropolitan University.

“The Middle East is a key economic battleground, because the US is pushing allies there to avoid Chinese tech, therefore using it as a middle ground,” he said.

To push back, Downes said China may turn to non-aligned countries, potentially Malaysia and Vietnam, to circumvent US controls.

Không có file đính kèm.

Nguồn tham khảo

OpenAI ChatGPT AI chips-hardware-compute 2025-05-23 05:43:20

CFO của OpenAI : phần cứng AI sẽ thúc đẩy đăng ký ChatGPT trong 'kỷ nguyên mới của điện toán'

OpenAI tuyên bố chi khoảng 6,4 tỷ USD để mua lại io, startup thiết bị do Jony Ive – cựu thiết kế trưởng của Apple – sáng lập cách đây khoảng một năm, dù công ty này hiện chưa có sản phẩm ra thị trường.
CFO Sarah Friar của OpenAI cho biết khoản đầu tư này dựa vào niềm tin vào con người và tiềm năng dài hạn, nhấn mạnh sự quan trọng của việc hiểu chuỗi cung ứng, thiết kế và sản xuất thiết bị.
Bà Friar nhận định phần cứng AI là bước tiếp theo trong việc tạo ra giá trị mới cho OpenAI, đưa công nghệ của công ty đến tay nhiều người dùng hơn và từ đó gia tăng thuê bao cho ChatGPT.
OpenAI hiện có 500 triệu người dùng hoạt động hàng tuần; lượng người dùng hàng tháng còn cao hơn, theo chia sẻ từ bà Friar.
Bà cho rằng thiết bị mới có thể mở rộng mô hình kinh doanh, hướng đến một loại đăng ký ChatGPT nâng cao và liên tục hơn.
Sự xuất hiện của thiết bị AI chuyên biệt được kỳ vọng sẽ mở ra “kỷ nguyên điện toán mới”, có thể thay thế vai trò của iPhone – quan điểm được nhiều lãnh đạo ngành công nghệ chia sẻ gần đây.
Dù OpenAI vẫn hợp tác với Apple trong tích hợp Siri và iPhone, công ty muốn sở hữu thiết bị riêng để duy trì đổi mới công nghệ trong hệ sinh thái rộng hơn.
Những thiết bị tương lai có thể không có màn hình cảm ứng, dựa trên khả năng tương tác tự nhiên như nhìn, nghe và nói – điểm mạnh của các mô hình AI hiện tại.
Bà Friar từ chối tiết lộ chi tiết về sản phẩm sắp tới, nhấn mạnh yếu tố “bí ẩn” và văn hóa giữ kín thông tin của đội ngũ cũ đến từ Apple.

📌 OpenAI đầu tư 6,4 tỷ USD vào startup io của Jony Ive nhằm tạo ra thiết bị AI chuyên biệt, vượt khỏi giới hạn điện thoại. Với 500 triệu người dùng hàng tuần, OpenAI kỳ vọng thiết bị mới sẽ thúc đẩy tăng trưởng thuê bao ChatGPT và mở ra mô hình kinh doanh dài hạn. Thiết bị tương lai có thể không dùng màn hình, tận dụng khả năng tương tác tự nhiên của AI, báo hiệu một kỷ nguyên điện toán mới.

https://www.cnbc.com/2025/05/22/openai-cfo-says-ai-hardware-boost-chatgpt-in-new-era-of-computing-.html

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-05-22 07:50:17

Kỷ nguyên nhà máy AI bắt đầu: GPU, đám mây chủ quyền và AI tự tối ưu hóa hạ tầng

Hội nghị Dell Technologies World 2025 tập trung vào kỷ nguyên mới: "AI factory", nơi AI được huấn luyện, suy luận và triển khai ở quy mô chưa từng có.
Nvidia giữ vị trí thống trị với hơn 90% thị phần GPU AI, nhưng sự phụ thuộc vào nguồn cung hạn chế khiến nhiều hyperscaler hướng đến XPU – chip AI chuyên biệt, kết hợp với GPU trong các cụm hỗn hợp để giảm chi phí 20–30% và kiểm soát hạ tầng tốt hơn.
Hai xu hướng hạ tầng nổi bật: hệ mở linh hoạt (theo kiểu hyperscaler) và hệ kín tích hợp sẵn (ưu tiên bởi doanh nghiệp vừa và nhỏ).
Nhà máy AI gồm ba lớp:
- Huấn luyện yêu cầu GPU/XPU mạnh, băng thông bộ nhớ và mạng cực cao.
- Suy luận reasoning làm bùng nổ khối lượng xử lý, với chuỗi suy nghĩ có thể tăng token lên gấp 10 lần.
- Triển khai inference cần độ trễ thấp, từ đám mây đến thiết bị biên như robot, drone hay cảm biến công nghiệp.
Xu hướng Edge AI và đám mây chủ quyền gia tăng do quy định dữ liệu quốc gia. Các nhà mạng muốn AI nằm trong biên giới để duy trì quyền kiểm soát và bảo mật.
AI đang hội tụ với công nghệ vật lý: robot hậu cần, camera an toàn, twin số — dự báo hàng chục triệu node AI sẽ hoạt động ngoài trung tâm dữ liệu vào năm 2026.
Doanh nghiệp đang tăng đầu tư AI nhờ:
- ROI rõ ràng hơn,
- cụm GPU/XPU hỗn hợp hiệu quả chi phí,
- vai trò mới của Chief AI Officer.
Mỗi bước tiến về thuật toán giúp giảm chi phí token 2–4 lần, nhưng các mô hình đa bước và đa phương thức lại làm tăng nhu cầu gấp 10–20 lần – tạo thành vòng xoáy tăng trưởng AI.
Mỹ-Trung căng thẳng khiến nhà sản xuất di dời khỏi Trung Quốc, ưu tiên logistics linh hoạt như chuyển sang Mexico hoặc Canada.
Các xu hướng mới như: trung tâm dữ liệu như máy tính hợp nhất, AI tự tối ưu hóa hạ tầng, phối hợp silicon-quang học và mô hình mở như Kubernetes sẽ định hình AI trong thập kỷ tới.

📌 Kỷ nguyên “nhà máy AI” khởi động với các siêu cụm GPU/XPU, mô hình reasoning tiêu thụ hàng trăm triệu token, và đòi hỏi hạ tầng mạng, lưu trữ và điện toán thích nghi nhanh chóng. Từ đám mây đến thiết bị biên, doanh nghiệp và hyperscaler đang tranh nhau giành lợi thế. 2025 là năm bản lề để xác định vị thế AI cho cả thập kỷ tới!

https://siliconangle.com/2025/05/19/welcome-ai-factory-era-preview-dell-technologies-world-2025/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute AI pháp lý-quản trị-chủ quyền 2025-05-22 07:28:06

Malaysia "quay xe" phút chót, “né” chip AI Huawei giữa căng thẳng Mỹ - Trung

Malaysia vừa bất ngờ rút lui khỏi tuyên bố sẽ xây dựng hệ thống AI quốc gia đầu tiên sử dụng chip Ascend 910 của Huawei, chỉ một ngày sau khi công bố dự án.
Thứ trưởng Truyền thông Teo Nie Ching từng thông báo rằng 3.000 máy chủ AI của Huawei sẽ được triển khai tại Malaysia trước năm 2026, cùng với sự hợp tác từ startup Trung Quốc DeepSeek. Tuy nhiên, văn phòng của bà sau đó rút lại tuyên bố mà không đưa ra lý do.
Đại diện Huawei xác nhận rằng chưa bán chip Ascend tại Malaysia và chính phủ nước này cũng chưa mua bất kỳ lô hàng nào.
Thay đổi này diễn ra sau khi Bộ Thương mại Mỹ ban hành — rồi chỉnh sửa — cảnh báo rằng việc sử dụng chip Ascend ở bất kỳ đâu trên thế giới có thể vi phạm các quy định kiểm soát xuất khẩu, trước khi rút lại phần khẳng định phạm vi toàn cầu trong bối cảnh căng thẳng với Trung Quốc.
Chính quyền Trump đang áp dụng chiến lược “ngoại giao AI” mới, với mục tiêu đưa phần cứng AI của Mỹ (đặc biệt là từ Nvidia và AMD) đến các thị trường như Đông Nam Á và Trung Đông, nhằm ngăn chặn Trung Quốc mở rộng ảnh hưởng.
Trong bối cảnh này, Malaysia là mục tiêu trọng điểm. Các hãng Mỹ như Oracle đang có kế hoạch xây dựng cụm trung tâm dữ liệu lớn tại đây, yêu cầu nhập khẩu lượng chip Nvidia cao cấp vượt quá giới hạn của quy định thời Biden.
Malaysia cũng bị nghi là điểm trung chuyển chip bất hợp pháp cho Trung Quốc. Một vụ án ở Singapore liên quan đến lô máy chủ AI được ngụy trang điểm đến đang khiến giới chức Malaysia điều tra.
Huawei hiện được xem là đối thủ đáng gờm của Nvidia tại Trung Quốc, đặc biệt sau bước đột phá chip trong điện thoại Mate 60 Pro năm 2023 và mở rộng sang AI, xe điện.

📌 Malaysia đột ngột rút khỏi dự án AI với Huawei, phản ánh sự giằng co giữa hai thế lực công nghệ Mỹ - Trung. Dự kiến triển khai 3.000 máy chủ AI Huawei đến 2026 đã bị rút lại, giữa lúc Mỹ cảnh báo sử dụng chip Ascend có thể vi phạm kiểm soát xuất khẩu. Malaysia trở thành tâm điểm trong cuộc đua AI toàn cầu, khi các công ty Mỹ muốn mở rộng nhưng vẫn phải dè chừng việc rò rỉ công nghệ sang Trung Quốc.

https://www.bangkokpost.com/business/general/3030290/malaysia-backtracks-on-huawei-ai-deal

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-05-19 20:46:27

Nvidia tung NVLink Fusion gây sốc: kết nối chip đối thủ, giữ vững ngôi vương AI toàn cầu

Nvidia công bố nhiều công nghệ mới tại hội nghị Computex 2025 để củng cố vai trò trung tâm trong lĩnh vực AI, nổi bật là chương trình NVLink Fusion.
NVLink Fusion cho phép khách hàng sử dụng CPU và GPU không do Nvidia sản xuất cùng với GPU của hãng thông qua công nghệ NVLink – trước đây chỉ hỗ trợ chip Nvidia.
CEO Jensen Huang khẳng định: “NVLink Fusion cho phép xây dựng hạ tầng AI bán tùy chỉnh, không chỉ là chip bán tùy chỉnh”.
Công nghệ này mở rộng khả năng kết nối với các CPU và ASIC từ các hãng thứ ba như MediaTek, Marvell, Alchip, Astera Labs, Synopsys, Cadence, và các khách hàng lớn như Fujitsu, Qualcomm.
Các hãng công nghệ lớn như Google, Microsoft, Amazon – vừa là đối thủ vừa là khách hàng Nvidia – đang tự phát triển chip riêng. NVLink Fusion giúp Nvidia duy trì vai trò trung tâm dù hệ thống không hoàn toàn dựa trên chip Nvidia.
Ray Wang nhận định NVLink Fusion mở rộng dấu chân Nvidia trong các trung tâm dữ liệu AI thế hệ mới, đặc biệt là hệ thống tích hợp đa hãng.
Tuy nhiên, chuyên gia Rolf Bulk cảnh báo rằng sự linh hoạt có thể làm giảm nhu cầu với CPU của Nvidia, nhưng vẫn giúp GPU Nvidia cạnh tranh hơn với kiến trúc mới nổi.
Nvidia cũng ra mắt hệ thống Grace Blackwell GB300 mới, ra mắt quý 3/2025, nâng hiệu suất toàn hệ thống cho AI.
Giới thiệu nền tảng NVIDIA DGX Cloud Lepton, kết nối hàng chục ngàn GPU từ mạng lưới nhà cung cấp đám mây toàn cầu, hỗ trợ nhu cầu GPU hiệu suất cao.
Nvidia sẽ mở văn phòng mới tại Đài Loan và hợp tác với Foxconn để xây dựng siêu máy tính AI, đồng thời hỗ trợ các đối tác lớn như TSMC.

📌 Nvidia gây ấn tượng tại Computex 2025 với NVLink Fusion – cho phép dùng chip của đối thủ cùng GPU Nvidia, giúp hãng giữ vững vị thế trung tâm AI. Hơn 6 đối tác chip lớn đã tham gia chương trình. Đồng thời, Nvidia công bố DGX Cloud Lepton và hệ thống AI GB300, cùng dự án siêu máy tính với Foxconn tại Đài Loan.

https://www.cnbc.com/2025/05/19/nvidia-announces-new-tech-to-keep-it-at-the-center-of-ai-development-.html

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute AI pháp lý-quản trị-chủ quyền 2025-05-19 06:14:29

CEO Nvidia mở tiệc mừng AI Blackwell, bác bỏ tin đồn về chip tại Trung Quốc

Vào ngày 17/05/2025, CEO Nvidia Jensen Huang đã tổ chức một bữa tiệc tối tại Đài Bắc để kỷ niệm việc sản xuất hàng loạt hệ thống AI Blackwell – sản phẩm chủ lực mới của Nvidia.
Bữa tiệc có sự góp mặt của các nhà cung ứng quan trọng từ Đài Loan, thể hiện vai trò then chốt của khu vực này trong chuỗi cung ứng toàn cầu của Nvidia.
Huang bày tỏ sự biết ơn tới các đối tác Đài Loan, đồng thời công bố kế hoạch gặp mặt nhà sáng lập TSMC – ông Morris Chang.
Ông phủ nhận hoàn toàn các báo cáo cho rằng Nvidia sẽ hạ cấp chip Hopper H20 khi ra mắt tại Trung Quốc vào tháng 7, khẳng định kiến trúc chip Hopper sẽ không thay đổi.
Nvidia hiện đang đánh giá cách tiếp cận thị trường AI Trung Quốc trong bối cảnh các hạn chế xuất khẩu từ Hoa Kỳ.
Về mặt chính sách, Huang chỉ trích quyết định ngăn chặn sự lan rộng công nghệ của Mỹ là “hoàn toàn sai lầm”, phản ánh căng thẳng sâu sắc trong cuộc cạnh tranh công nghệ Mỹ-Trung.
Cuộc cạnh tranh này đã diễn ra từ thập niên 1980 và hiện tập trung mạnh vào các công nghệ lõi như chip bán dẫn và AI tạo sinh.
Chính quyền Biden từng áp dụng chiến lược ba tầng về quyền truy cập AI chip, sau đó bất ngờ thu hồi chỉ hai ngày trước khi áp dụng, khiến các công ty như Nvidia đối mặt với sự bất định lớn.
Nvidia phải đầu tư lớn để theo dõi chuỗi cung ứng và đảm bảo chip không bị rò rỉ sang các thị trường bị hạn chế thông qua nước thứ ba.
Các chuyên gia cho rằng các biện pháp kiểm soát công nghệ nên đi kèm với chiến lược ngoại giao, vì biện pháp cấm đoán đơn độc không hiệu quả.

📌 Nvidia tổ chức tiệc tại Đài Loan đánh dấu sản xuất hàng loạt hệ thống AI Blackwell, đồng thời khẳng định không thay đổi chip Hopper dù gặp rào cản xuất khẩu sang Trung Quốc. CEO Jensen Huang chỉ trích chính sách hạn chế lan tỏa công nghệ của Mỹ và nhấn mạnh cần cách tiếp cận cân bằng để phục vụ thị trường AI toàn cầu.

https://www.techinasia.com/news/nvidia-ceo-celebrates-blackwell-ai-launch-with-taiwan-suppliers

#TechinAsia

Nvidia CEO celebrates Blackwell AI launch with Taiwan suppliers

Nvidia CEO Jensen Huang hosted a dinner in Taipei on May 17, 2025, to celebrate the mass production of the company’s new Blackwell AI systems.

The event included key Taiwanese suppliers, highlighting their important role in Nvidia’s supply chain.

Earlier, Huang expressed gratitude to Nvidia’s Taiwanese partners and shared plans to meet with TSMC founder Morris Chang.

Huang denied reports of a downgraded launch for the Hopper H20 chip in China in July, stating there would be no changes to the Hopper chip architecture.

He mentioned Nvidia is assessing how to navigate the Chinese AI market amid export restrictions.

🧠 Food for thought

1️⃣ AI chip export policies reflect broader U.S.-China technological competition

Huang’s comments on Trump’s reversal of the “AI Diffusion Rule” highlight a critical tension in U.S. tech policy that has evolved over decades.

The U.S.-China technological rivalry has deep roots dating back to the 1980s, with both nations viewing AI dominance as crucial for national security and global influence today 1.

This competition has intensified particularly around key technological battlegrounds, including semiconductor manufacturing, which explains why advanced AI chips like Nvidia’s have become central to export control debates 1.

The Biden administration’s now-rescinded three-tier approach to AI chip access represented just one phase in an ongoing policy evolution that has included tariffs and increasingly targeted restrictions on Chinese access to advanced technologies 2.

Huang’s characterization of limiting the global spread of U.S. technology as “completely wrong” aligns with arguments from technology companies that overly restrictive policies may ultimately prove counterproductive to American interests.

2️⃣ Export controls create complex business challenges for global tech companies

Nvidia’s careful positioning around China access to its advanced chips demonstrates how technology companies must navigate increasingly complicated regulatory landscapes.

Huang’s precise clarification that “there will be no changes to its advanced Hopper chip architecture” while also indicating the company is “still assessing how to best serve China’s AI market” reflects the high-stakes balancing act tech companies face.

The constant evolution of export regulations, evidenced by the rapid reversal of the Biden-era rule just two days before implementation, creates significant business uncertainty for companies with global supply chains and customers 3.

Experts have argued that technology denial measures alone are insufficient for addressing concerns about China’s technology practices, suggesting the need for more coordinated diplomatic approaches that tech companies must anticipate 4.

Huang’s comments about monitoring chip movements emphasize how compliance with export controls has become a critical business function for companies like Nvidia, requiring significant resources to ensure their products don’t reach restricted markets through third countries.

Không có file đính kèm.

Nguồn tham khảo

AI market AI chips-hardware-compute 2025-05-16 05:39:19

Mỹ và UAE hợp tác xây dựng trung tâm dữ liệu AI lớn nhất ngoài nước Mỹ tại Abu Dhabi công suất 5 gigawatt

Mỹ và Các Tiểu vương quốc Ả Rập Thống nhất (UAE) vừa công bố hợp tác xây dựng một siêu khuôn viên trung tâm dữ liệu AI tại Abu Dhabi, được mô tả là cơ sở lớn nhất bên ngoài nước Mỹ.
Trung tâm dữ liệu này do G42, một công ty công nghệ của UAE, xây dựng với sự tham gia của nhiều công ty Mỹ chưa được tiết lộ tên, theo thông báo từ Bộ Thương mại Mỹ.
Cơ sở sẽ có công suất 5 gigawatt và chiếm diện tích 10 dặm vuông (~25,9 km²), đánh dấu một bước tiến lớn trong việc thiết lập hạ tầng AI tại Trung Đông.
Tổng thống Donald Trump công bố dự án trong chuyến thăm chính thức UAE, là chặng thứ ba trong hành trình tới Trung Đông, nơi ông gặp gỡ lãnh đạo các nước và ký kết một loạt thỏa thuận quan trọng.
Các nhân vật cấp cao như Jensen Huang (Nvidia), Sam Altman (OpenAI), Masayoshi Son (SoftBank) và Jeetu Patel (Cisco) đều có mặt tại UAE trong dịp này, cho thấy tầm quan trọng chiến lược của dự án.
Bộ trưởng Thương mại Mỹ Howard Lutnik khẳng định các công ty Mỹ sẽ vận hành trung tâm dữ liệu và cung cấp dịch vụ đám mây do Mỹ quản lý tại khu vực, đảm bảo an ninh công nghệ nghiêm ngặt và ngăn chặn việc chuyển giao trái phép công nghệ.
UAE coi dự án này là bước tiến quan trọng giúp khu vực trở thành trung tâm nghiên cứu công nghệ tiên tiến và phát triển bền vững.
Giai đoạn đầu của dự án sẽ triển khai một trung tâm dữ liệu AI với công suất 1 gigawatt, mở đường cho các giai đoạn mở rộng sau này.

📌 Dự án AI quy mô khổng lồ giữa Mỹ và UAE sẽ xây dựng trung tâm dữ liệu 5 gigawatt tại Abu Dhabi, do G42 thực hiện cùng các công ty Mỹ, với diện tích 10 dặm vuông. Đây là bước đi chiến lược nhằm đưa UAE trở thành trung tâm AI và đảm bảo an ninh công nghệ Mỹ tại Trung Đông.

https://www.cnbc.com/2025/05/15/white-house-announces-ai-data-campus-partnership-with-the-uae.html

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute AI pháp lý-quản trị-chủ quyền 2025-05-14 07:26:46

Nhập khẩu GPU vào Malaysia tăng 3.400% chỉ trong tháng 4/2025, nghi lách lệnh cấm xuất khẩu sang Trung Quốc

Theo dữ liệu từ Cục Quản lý Thương mại Quốc tế Đài Loan, nhập khẩu GPU vào Malaysia đã đạt 2,74 tỷ USD trong tháng 4/2025, tăng 3.400% so với cùng kỳ 2023.
Tổng giá trị GPU nhập khẩu trong 4 tháng đầu năm 2025 đạt khoảng 6,45 tỷ USD, vượt toàn bộ lượng nhập năm 2024.
Tháng 1/2025 ghi nhận mức 1,12 tỷ USD (tăng 700% so với năm trước), tháng 2 đạt 627 triệu USD, và tháng 3 tăng vọt lên 1,96 tỷ USD – cũng là mức tăng 3.400%.
Xu hướng nhập khẩu tăng đột biến này đang làm dấy lên nghi ngờ rằng Malaysia đang được sử dụng làm điểm trung chuyển để đưa GPU bị hạn chế đến Trung Quốc, nơi đang chịu lệnh cấm nghiêm ngặt từ Mỹ.
Một xu hướng tương tự xảy ra với hệ thống máy tính xuất khẩu từ Đài Loan sang Malaysia trong tháng 3/2025, đạt 1,87 tỷ USD – tăng 55.117% so với tháng 3/2023.
Nhiều nguồn tin cho rằng các công ty Trung Quốc có thể đang đặt mua chip Blackwell hoặc card Nvidia thông qua các quốc gia lân cận như Malaysia và Singapore nhằm né tránh lệnh cấm AI từ Mỹ.
Nvidia không công bố chi tiết số lượng hàng xuất sang Malaysia do thay đổi cách báo cáo: dựa trên địa chỉ thanh toán thay vì điểm đến vật lý, làm dấy lên nghi ngờ về tính minh bạch.
Quy định mới có tên "AI Diffusion Rule" sẽ có hiệu lực vào ngày 15/5, có thể khiến Malaysia trở thành cửa hậu cho công nghệ bị hạn chế.
Bất chấp việc Mỹ kêu gọi Malaysia siết chặt kiểm soát xuất khẩu công nghệ cao sang Trung Quốc, tình trạng nhập khẩu vẫn tăng mạnh, dẫn đến lo ngại về buôn lậu GPU quy mô lớn.

📌 Malaysia ghi nhận mức tăng nhập khẩu GPU kỷ lục 3.400% trong năm 2025, đạt 6,45 tỷ USD chỉ sau 4 tháng. Các dấu hiệu cho thấy nước này có thể đang trở thành điểm trung chuyển GPU bị hạn chế sang Trung Quốc, bất chấp nỗ lực kiểm soát từ Mỹ. Nvidia không minh bạch số liệu vận chuyển, càng làm tăng lo ngại về việc lách lệnh cấm.

https://www.tomshardware.com/pc-components/gpus/gpu-imports-to-malaysia-surge-by-3-400-percent-in-2025-raising-alarm-amid-smuggling-investigations

Không có file đính kèm.

Nguồn tham khảo

OpenAI ChatGPT AI chips-hardware-compute 2025-05-09 06:17:15

OpenAI ra mắt sáng kiến “OpenAI for Countries” nhằm hỗ trợ các quốc gia xây dựng hạ tầng AI dân chủ

OpenAI công bố sáng kiến OpenAI for Countries, một phần của dự án Stargate nhằm hợp tác với các quốc gia muốn phát triển hạ tầng AI dựa trên giá trị dân chủ, thay vì theo mô hình AI độc đoán tập trung quyền lực.
Sáng kiến ra đời sau khi nhiều quốc gia bày tỏ mong muốn xây dựng hạ tầng tương tự Stargate Mỹ, hiện đang triển khai tại Abilene, Texas, với sự hợp tác giữa OpenAI, Oracle và SoftBank.
Mục tiêu là xây dựng nền tảng công nghệ giúp thúc đẩy tăng trưởng kinh tế, tạo ngành công nghiệp mới và mở rộng quyền tự do học hỏi, sáng tạo, sản xuất của con người thông qua AI.
Các hoạt động hợp tác trong khuôn khổ OpenAI for Countries bao gồm:
- Xây dựng trung tâm dữ liệu nội địa, đảm bảo chủ quyền dữ liệu và khả năng tùy chỉnh AI theo luật và văn hóa địa phương.
- Triển khai ChatGPT bản địa hóa, hỗ trợ y tế, giáo dục và dịch vụ công, được thiết kế riêng theo nhu cầu ngôn ngữ và văn hóa từng nước.
- Tăng cường kiểm soát an toàn và bảo mật AI, đảm bảo tôn trọng nhân quyền và quy trình dân chủ trong sử dụng mô hình AI mạnh.
- Thành lập quỹ khởi nghiệp quốc gia, phối hợp giữa vốn OpenAI và đầu tư địa phương để phát triển hệ sinh thái AI nội địa, tạo việc làm, công ty mới và cộng đồng công nghệ.
Các quốc gia đối tác cũng sẽ đầu tư vào việc mở rộng Stargate Project toàn cầu, củng cố vai trò lãnh đạo của Mỹ trong AI dân chủ.
Giai đoạn đầu, OpenAI dự kiến thực hiện 10 dự án với các quốc gia hoặc khu vực, sau đó sẽ tiếp tục mở rộng quy mô.
Các chính phủ quan tâm có thể liên hệ qua các đại diện OpenAI tại Mỹ hoặc văn phòng toàn cầu để bắt đầu hợp tác.

📌 Với OpenAI for Countries, OpenAI cam kết hỗ trợ các nước xây dựng hạ tầng AI dân chủ, dữ liệu có chủ quyền và ChatGPT bản địa hóa, đồng thời thành lập quỹ AI quốc gia. Sáng kiến hướng đến 10 quốc gia đầu tiên, chống lại xu hướng AI tập trung quyền lực, bảo vệ nhân quyền và thúc đẩy tăng trưởng kinh tế thông minh, công bằng.

https://openai.com/global-affairs/openai-for-countries/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute AI pháp lý-quản trị-chủ quyền 2025-05-07 06:38:46

Bóc trần mạng lưới buôn lậu chip Nvidia: Trung Quốc vẫn ung dung dùng chip bị cấm để phát triển AI

Dù Mỹ cấm bán chip AI cao cấp như H100, A100, H20 của Nvidia sang Trung Quốc, các công ty Trung Quốc vẫn tiếp cận thông qua trung tâm dữ liệu nước ngoài, trung gian và buôn lậu trực tiếp.
Johor (Malaysia) đã trở thành cửa hậu lý tưởng: chi phí rẻ, luật lỏng và gần Singapore – nơi các công ty như ByteDance thuê máy chủ để lách lệnh cấm.
Gần một nửa công suất trung tâm dữ liệu Johor năm 2027 dự kiến sẽ sử dụng chip AI như Nvidia, theo ước tính của SemiAnalysis.
Dữ liệu thương mại cho thấy xuất khẩu GPU từ Đài Loan sang Malaysia đạt 3,6 tỷ USD quý I/2025, gần bằng cả năm 2024. Riêng tháng 3, con số lên tới gần 2 tỷ USD.
Ngoài thuê điện toán đám mây, chip bị buôn lậu trực tiếp qua các nước trung gian, thông qua công ty bình phong, giả mạo giấy tờ và đổi nhãn mác hàng hóa.
Theo Viện Chính sách và Chiến lược AI (Mỹ), 10–50% công suất huấn luyện AI của Trung Quốc trong năm 2024 có thể đến từ chip lậu Mỹ.
Trước năm 2022, 22% doanh thu Nvidia đến từ Trung Quốc; nay chỉ còn 13%, nhưng doanh số tại Singapore đã tăng gấp đôi, chiếm 18% – dù chưa đến 2% chip thực sự được dùng tại đó.
Một vụ án Singapore năm 2025 cho thấy 390 triệu USD máy chủ chứa chip Nvidia được xuất qua Malaysia – nghi bị tái xuất về Trung Quốc.
Mỹ đã áp lệnh cấm lên một số công ty Ấn Độ xuất khẩu chip từ Mỹ sang Nga – như Shreya Life Sciences, công ty dược lại là đầu mối bán hàng công nghệ trị giá 322 triệu USD.
Nvidia đang gặp khó khi bị yêu cầu kiểm soát đầu cuối, dù công ty bán chip qua nhiều lớp như Google, Dell, Supermicro... khiến kiểm tra người dùng cuối gần như bất khả thi.
Bộ Thương mại Mỹ đã chia thế giới thành 3 nhóm theo AI Diffusion Framework:
- Nhóm 1 (Anh, Nhật…) không giới hạn
- Nhóm 2 (Singapore, Ấn Độ…) bị hạn ngạch
- Nhóm 3 (Trung Quốc, Nga) bị cấm hoàn toàn
Tuy nhiên, BIS (Bureau of Industry and Security) chỉ có 1 cán bộ phụ trách toàn Đông Nam Á và châu Úc, trong khi ngân sách còn bị cắt 12%.
Nvidia phản đối giải pháp vô hiệu hóa chip ở nơi bị cấm vì lo ngại lỗ hổng bảo mật, đề xuất giám sát bằng phần mềm gửi dữ liệu vị trí và cấu hình.
Dù có thêm lệnh cấm, quản lý chip AI toàn cầu là bất khả thi, và giải pháp thực tế duy nhất là tăng tốc đổi mới công nghệ để đi trước Trung Quốc.

📌 Trung Quốc vẫn tiếp cận chip Nvidia bị cấm thông qua Malaysia, Singapore và buôn lậu trung gian, bất chấp các lệnh kiểm soát ngày càng chặt từ Mỹ. Với gần 2 tỷ USD GPU đổ vào Malaysia chỉ trong tháng 3/2025, thị trường xám chip AI đang trở thành cuộc chiến ngầm khó kiểm soát. Mỹ có thể không ngăn được hoàn toàn, và chỉ còn cách đi trước bằng đổi mới công nghệ.

https://www.economist.com/business/2025/05/05/inside-the-shadowy-business-of-ai-chip-smuggling

Trung Quốc vẫn đang lấy được thiết bị của Nvidia như thế nào

Bên trong ngành kinh doanh buôn lậu chip AI đầy bí ẩn

5 tháng 5, 2025

Tháng trước, Jensen Huang, giám đốc của Nvidia, đã đến Bắc Kinh với một thông điệp rõ ràng: nhà sản xuất chip trí tuệ nhân tạo (AI) hàng đầu thế giới dự định "phục vụ thị trường Trung Quốc không dao động". Hoa Kỳ thì lại muốn điều ngược lại. Vài ngày trước đó, chính quyền Trump đã đưa ra các biện pháp kiểm soát mới mà về cơ bản cấm công ty bán bộ vi xử lý H20 cho Trung Quốc.

Trong vài năm qua, Hoa Kỳ đã tìm cách làm suy yếu đối thủ chính trong cuộc đua AI bằng cách kiểm soát quyền tiếp cận các bán dẫn tiên tiến. Hiệu suất của bộ xử lý AI phụ thuộc chủ yếu vào hai yếu tố: sức mạnh tính toán (tốc độ xử lý dữ liệu của chip) và băng thông bộ nhớ (tốc độ di chuyển dữ liệu giữa bộ xử lý và bộ nhớ). Vào tháng 10 năm 2022, chính quyền Biden đã cấm bán cho Trung Quốc các chip Mỹ vượt quá ngưỡng về cả hai mặt. Nvidia đáp ứng bằng mẫu H800, một mô hình được sản xuất cho Trung Quốc, được thiết kế để duy trì ngay dưới các giới hạn. Một năm sau, Hoa Kỳ lại thắt chặt quy định, cấm bất kỳ chip nào có sức mạnh tính toán quá lớn, bất kể băng thông bộ nhớ. Câu trả lời của Nvidia là H20.

Vấn đề đối với Hoa Kỳ là các chip Nvidia bị hạn chế vẫn tiếp tục đến tay các nhà phát triển AI Trung Quốc. Một chuỗi cung ứng bí ẩn đã xuất hiện, được thiết kế để làm việc xung quanh các lệnh trừng phạt. Một số khách hàng thuê quyền truy cập vào các trung tâm dữ liệu ở nước ngoài; những người khác mua chip thông qua các trung gian mờ ám. Một vòng hạn chế mới, dự kiến có hiệu lực vào ngày 15 tháng 5, nhằm mục đích thắt chặt mạng lưới hơn nữa. Các quy tắc mới nhắm mục tiêu không chỉ vào phần cứng, mà còn cả các nhà cung cấp đám mây cung cấp quyền truy cập vào nó. Tuy nhiên, chúng có thể cũng sẽ thất bại.

Để hiểu tại sao việc hạn chế tiếp cận chip AI lại khó khăn như vậy, hãy xem xét Johor, một phần của miền nam Malaysia từng được biết đến nhiều hơn với các đồn điền dầu cọ. Nằm ngay qua biên giới từ Singapore, khu vực này đã trở thành trung tâm cho các trung tâm dữ liệu. Đất đai và điện giá rẻ, và giấy phép dễ có được hơn ở thành phố-quốc gia. Tất cả các nhà cung cấp đám mây lớn của Mỹ - Amazon, Google, Microsoft và Oracle - đều đã thiết lập cơ sở. Theo Knight Frank, một công ty tư vấn bất động sản, tổng công suất trung tâm dữ liệu của Johor (đã xây dựng, đang xây dựng hoặc đã lên kế hoạch) đã tăng từ 10 megawatt vào đầu năm 2021 lên hơn 1.500 megawatt vào năm 2024.

Johor cũng cung cấp một cửa sau thuận tiện vào Trung Quốc. Các công ty lớn của Trung Quốc như ByteDance, chủ sở hữu của TikTok, đã thuê công suất ở đó. Việc thuê công suất đám mây ở Malaysia cho phép các công ty như vậy có quyền truy cập vào các chip không thể nhập khẩu vào Trung Quốc. SemiAnalysis, một công ty tư vấn, ước tính rằng gần một nửa công suất trung tâm dữ liệu dự kiến của Johor vào năm 2027 sẽ tích hợp các bộ xử lý AI như của Nvidia. Các nhà điều hành trung tâm dữ liệu Malaysia khẳng định rằng họ tuân thủ các quy định xuất khẩu của Mỹ và không cung cấp công suất cho các đơn vị trong danh sách đen. Tuy nhiên, các cách giải quyết là đơn giản. Một luật sư tư vấn cho các công ty trong khu vực nói rằng các công ty Trung Quốc tương đối dễ dàng có được các chip AI bị hạn chế bằng cách thành lập các công ty con địa phương.

Các số liệu về luồng thương mại hỗ trợ điều này. Các chip cao cấp của Nvidia được sản xuất bởi TSMC, nhà sản xuất chip lớn nhất thế giới, trong các nhà máy Đài Loan. Trong quý đầu tiên của năm nay, Đài Loan đã xuất khẩu 3,6 tỷ đô la giá trị các đơn vị xử lý đồ họa - loại được sử dụng để huấn luyện các mô hình AI - sang Malaysia, gần bằng tổng số cho cả năm 2024. Chỉ riêng trong tháng 3, lô hàng đã tăng hơn ba lần so với tháng trước, đạt gần 2 tỷ đô la.

Sau đó là các nhà buôn lậu vận chuyển chip trực tiếp vào Trung Quốc. Các chip này thường được chuyển hướng qua các quốc gia thứ ba không nằm trong các hạn chế của Mỹ. Một nguồn tin quen thuộc với thực tiễn này nói rằng hàng hóa thường đi qua một số khu vực pháp lý và công ty bình phong để che giấu nguồn gốc. Giấy tờ xuất khẩu bị làm giả; các sản phẩm bị hạn chế được gắn nhãn sai để qua mặt hải quan. Erich Grunewald thuộc Viện Chính sách và Chiến lược AI, một tổ chức tư vấn có trụ sở tại San Francisco, ước tính rằng năm ngoái, các chip Mỹ buôn lậu chiếm từ một phần mười đến một nửa công suất huấn luyện mô hình AI của Trung Quốc.

Trước vòng kiểm soát xuất khẩu đầu tiên vào năm 2022, Trung Quốc chiếm khoảng 22% doanh thu của Nvidia. Con số đó đã giảm xuống còn 13%. Đồng thời, doanh số bán cho Singapore - một thành phố với ít người dùng cuối - đã tăng hơn gấp đôi và giờ đây chiếm gần 18% tổng số, khiến Singapore trở thành thị trường lớn thứ hai của Nvidia sau Hoa Kỳ. Công ty nói rằng sự thay đổi là thông thường: nhiều khách hàng lập hóa đơn qua Singapore nhưng vận chuyển đến các điểm đến được phép. Chưa đến 2% chip bán ở đó được giao tại địa phương.

Tuy nhiên, vào tháng 2, cảnh sát Singapore đã bắt giữ ba người đàn ông liên quan đến việc bán các máy chủ trị giá 390 triệu đô la tích hợp chip Nvidia. Công tố viên cáo buộc rằng chúng đầu tiên được gửi đến các công ty Singapore, sau đó được tái xuất sang Malaysia. Liệu đó có phải là điểm dừng cuối cùng của chúng vẫn chưa được biết. Điều rõ ràng hơn là động lực: nhu cầu đã biến thị trường xám thành mỏ vàng. Theo một giám đốc điều hành ngành, các chip Nvidia bị cấm hiện bán với giá cao hơn 30-50% thông qua các trung gian.

Trung Quốc không phải là điểm đến duy nhất. Vào tháng 10, Hoa Kỳ đã đưa một số công ty Ấn Độ vào danh sách trừng phạt vì tái xuất khẩu các chip bị hạn chế sang Nga. Trong số đó có Shreya Life Sciences, một công ty dược phẩm có trụ sở tại Mumbai. Theo số liệu từ The Trade Vision, một nhà cung cấp dữ liệu, công ty đã xuất khẩu hàng hóa công nghệ trị giá 322 triệu đô la sang Nga vào năm 2024, phần lớn là máy chủ Dell có chứa chip Nvidia.

Tất cả điều này đặt Nvidia vào một vị trí khó khăn. Công ty khẳng định tuân thủ các quy tắc xuất khẩu của Mỹ. Nhưng hoạt động của công ty rất rộng lớn: dự kiến sẽ bán hơn 6 triệu chip AI trong năm nay và cách xa người dùng cuối nhiều bước. Nvidia cung cấp bộ xử lý cho các gã khổng lồ đám mây như Google và Microsoft, và cho các nhà sản xuất thiết bị như Dell và Supermicro, những công ty tích hợp chúng vào máy chủ. Từ đó, trách nhiệm về việc tuân thủ bị phân tán. Các nhà cung cấp đám mây và công ty phần cứng được yêu cầu kiểm tra khách hàng. Bản thân Nvidia tiến hành các cuộc kiểm toán định kỳ. Nhưng việc giám sát không đồng đều, và máy chủ thường đổi chủ một cách im lặng sau khi vượt qua các kiểm tra ban đầu. Một giám đốc điều hành tại một nhà sản xuất máy chủ nói rằng việc xác minh đúng đắn tất cả người dùng cuối là "gần như không thể".

Chính phủ Hoa Kỳ đã phản ứng bằng cách đưa ra các quy định ngày càng chặt chẽ hơn. Vào tháng 1, chính quyền Biden đã công bố "Khung phổ biến AI", chia thế giới thành ba cấp: 18 quốc gia đáng tin cậy bao gồm Anh và Nhật Bản không phải đối mặt với bất kỳ hạn chế nào; cấp thứ hai gồm 120 quốc gia bao gồm Singapore và Ấn Độ phải tuân theo hạn ngạch; và cấp cuối cùng bao gồm Trung Quốc và Nga bị cấm hoàn toàn. Các quy tắc cũng cấm các nhà cung cấp đám mây Mỹ cung cấp dịch vụ được hỗ trợ bởi các chip bị hạn chế cho khách hàng Trung Quốc. Theo báo cáo, chính quyền Trump đang lên kế hoạch điều chỉnh các quy định trước khi chúng có hiệu lực - có thể gắn quyền truy cập vào chip vào các cuộc đàm phán thương mại rộng hơn - nhưng vẫn chưa công bố bất kỳ thay đổi nào.

Chip đã ra khơi

Bất kỳ biện pháp kiểm soát mới nào cũng sẽ gặp phải những vấn đề quen thuộc. Cục Công nghiệp và An ninh (BIS), cơ quan được giao nhiệm vụ thực thi kiểm soát xuất khẩu công nghệ, thiếu nhân sự nghiêm trọng. Ông Grunewald lưu ý rằng chỉ có một viên chức kiểm soát xuất khẩu chịu trách nhiệm cho toàn bộ Đông Nam Á và Úc châu - một khu vực trung tâm cho thương mại ngầm về chip AI. Và khi mạng lưới quy định ngày càng phức tạp hơn, BIS còn bị kéo căng hơn nữa: ngân sách của cơ quan này bị cắt giảm 12% trong năm nay.

Một số chuyên gia đã đề xuất các giải pháp kỹ thuật, chẳng hạn như vô hiệu hóa chip được sử dụng ở các địa điểm bị cấm. Nvidia lập luận rằng các biện pháp kiểm soát ở cấp độ phần cứng như vậy sẽ gây ra các lỗ hổng nguy hiểm và không khả thi. Thay vào đó, công ty đề nghị các công cụ dựa trên phần mềm có thể truyền dữ liệu đo từ xa hạn chế - bao gồm thông tin về vị trí và cấu hình hệ thống - trở lại công ty để xác nhận rằng các chip đang ở nơi mà chúng được cho là ở đó.

Tuy nhiên, ngay cả việc thực thi tốt hơn cũng có những giới hạn. Nvidia không thể theo dõi mọi chip. BIS không thể kiểm tra mọi máy chủ. Những kẻ buôn lậu sẽ tiếp tục tìm ra những lỗ hổng. Nếu Hoa Kỳ muốn dẫn đầu Trung Quốc trong cuộc đua AI, sẽ cần đổi mới nhanh hơn, thay vì siết chặt hơn.

How China is still getting its hands on Nvidia’s gear

Inside the shadowy business of AI-chip smuggling

May 5th 2025

Last month Jensen Huang, the boss of Nvidia, landed in Beijing with a clear message: the maker of the world’s leading artificial-intelligence (AI) chips planned to “unswervingly serve the Chinese market”. America would rather it didn’t. A few days earlier the Trump administration had introduced new controls that, in effect, banned the company from selling its H20 microprocessor to China.

Over the past few years America has sought to hobble its main rival in the AI race by controlling access to its advanced semiconductors. The performance of an AI processor depends mostly on two factors: computing power (how fast a chip processes data) and memory bandwidth (how quickly it moves data between processor and memory). In October 2022 the Biden administration barred sales to China of American chips that exceed a threshold on both fronts. Nvidia responded with the H800, a made-for-China model engineered to stay just under the limits. A year later, America tightened the regulations again, banning any chip with too much computing power, regardless of memory bandwidth. Nvidia’s answer was the H20.

The trouble for America is that restricted Nvidia chips continue to make their way into the hands of Chinese AI developers. A shadowy supply chain has emerged, designed to work around sanctions. Some customers lease access to offshore data centres; others buy chips through murky intermediaries. A new round of restrictions, due to come into effect on May 15th, aims to tighten the net further still. The new rules target not just hardware, but also the cloud providers offering access to it. Yet they will probably fail, too.

To see why it is so difficult to restrict access to AI chips, consider Johor, a part of southern Malaysia once better known for its palm-oil plantations. Located just across the border from Singapore, the region has become a hub for data centres. Land and electricity are cheap, and permits easier to obtain than in the city-state. All the big American cloud providers—Amazon, Google, Microsoft and Oracle—have set up shop. According to Knight Frank, a property consultancy, Johor’s total data-centre capacity (built, under construction or planned) grew from 10 megawatts in early 2021 to more than 1,500 megawatts by 2024.

Johor also provides a convenient back door into China. Big Chinese firms such as ByteDance, the owner of TikTok, have rented capacity there. Leasing cloud capacity in Malaysia allows companies like it to gain access to chips that cannot be imported into China. SemiAnalysis, a consultancy, estimates that nearly half of Johor’s projected data-centre capacity in 2027 will incorporate AI processors such as Nvidia’s. Malaysian data-centre operators insist they comply with American export regulations and do not provide capacity to blacklisted entities. Yet workarounds are straightforward. A lawyer advising firms in the region says it is relatively easy for Chinese companies to get hold of restricted AI chips by setting up local subsidiaries.

Figures on trade flows support this. Nvidia’s high-end chips are produced by TSMC, the world’s biggest chipmaker, in its Taiwanese factories. In the first quarter of this year Taiwan exported $3.6bn-worth of graphics-processing units—the kind used to train AI models—to Malaysia, nearly matching the total for all of 2024 (see chart 1). In March alone shipments more than tripled from the previous month to reach almost $2bn.

Then there are the smugglers who traffic chips directly into China. These are typically diverted through third countries not covered by American restrictions. A source familiar with the practice says goods often pass through several jurisdictions and front companies to obscure their origin. Export papers are doctored; restricted products are mislabelled to slip past customs. Erich Grunewald of the Institute for AI Policy and Strategy, a think-tank based in San Francisco, estimates that last year smuggled American chips made up between one-tenth and one-half of China’s ai-model-training capacity.

Before the first round of export controls in 2022, China accounted for about 22% of Nvidia’s revenue (see chart 2). That share has since fallen to 13%. At the same time, sales to Singapore—a city with few end-users—have more than doubled, and now make up nearly 18% of the total, making it Nvidia’s second-largest market after America. The company says the shift is routine: many clients invoice through Singapore but ship to permitted destinations. Fewer than 2% of chips sold there are delivered locally.

In February, however, Singaporean police arrested three men over the sale of $390m-worth of servers that incorporated Nvidia chips. Prosecutors allege these were first sent to Singaporean firms, then re-exported to Malaysia. Whether that was their final stop remains unknown. What is clearer is the incentive: demand has turned the grey market into a gold mine. According to one industry executive, banned Nvidia chips now sell at a 30-50% markup through intermediaries.

China is not the only destination. In October America placed several Indian companies under sanctions for re-exporting restricted chips to Russia. Among them was Shreya Life Sciences, a pharmaceutical firm based in Mumbai. According to figures from The Trade Vision, a data provider, the company exported $322m-worth of tech goods to Russia in 2024, much of it Dell servers containing Nvidia chips.

All this puts Nvidia in a difficult position. The company insists it complies with American export rules. But its operations are vast: it expects to sell more than 6m AI chips this year and it sits several steps removed from the end user. Nvidia supplies processors to cloud giants such as Google and Microsoft, and to equipment-makers like Dell and Supermicro, which integrate them into servers. From there, responsibility for compliance is diffuse. Cloud providers and hardware firms are expected to vet their customers. Nvidia itself conducts periodic audits. But oversight is uneven, and servers often change hands quietly after passing initial checks. One executive at a server manufacturer says properly verifying all end users is “practically impossible”.

America’s government has responded by introducing ever tighter regulations. In January the Biden administration unveiled its “AI Diffusion Framework”, which splits the world into three tiers: 18 trusted countries including Britain and Japan face no restrictions; a second tier of 120 countries including Singapore and India are subject to quotas; and a final tier including China and Russia are barred outright. The rules also prohibit American cloud providers from offering services powered by restricted chips to Chinese customers. The Trump administration is reportedly planning to tinker with the regulations before they come into effect—perhaps tying access to chips into wider trade negotiations—but it is yet to announce any changes.

The chip has sailed

Any new controls will encounter familiar problems. The Bureau of Industry and Security (BIS), the agency tasked with enforcing tech export controls, is severely understaffed. Mr Grunewald notes that it has just one export-control officer responsible for all of South-East Asia and Australasia—a region central to the shadow trade in AI chips. And just as the regulatory web grows more intricate, BIS is being stretched even more: it faces a cut to its budget of 12% this year.

Some pundits have proposed technical solutions, such as disabling chips used in prohibited locations. Nvidia argues that such hardware-level controls would introduce dangerous vulnerabilities and are unworkable. Instead, it suggests that software-based tools could transmit limited telemetry—including information on location and system configuration—back to the company to confirm that the chips are where they are supposed to be.

Even better enforcement has its limits, however. Nvidia cannot trace every chip. BIS cannot inspect every server. Smugglers will continue to find loopholes. If America wants to keep ahead of China in the AI race, it will need to innovate faster, rather than clamp down harder. ■

Không có file đính kèm.

Nguồn tham khảo

AI pháp lý-quản trị-chủ quyền AI chips-hardware-compute 2025-05-07 06:33:27

Dự luật mới của Mỹ yêu cầu theo dõi vị trí chip AI như Nvidia sau khi bán để ngăn chặn tình trạng buôn lậu sang Trung Quốc

Hạ nghị sĩ Bill Foster chuẩn bị đề xuất dự luật yêu cầu theo dõi vị trí chip AI như Nvidia sau khi bán, để ngăn chặn tình trạng buôn lậu vào Trung Quốc – một mối đe dọa an ninh đang ngày càng rõ rệt.
Foster nhấn mạnh: “Đây không phải là vấn đề tương lai, mà là vấn đề ngay bây giờ” – với nguy cơ Trung Quốc dùng chip để phát triển vũ khí hoặc AI tổng quát (AGI).
Công nghệ theo dõi vị trí chip đã tồn tại và nhiều chip Nvidia đã tích hợp sẵn phần cứng hỗ trợ, theo các chuyên gia được Reuters phỏng vấn.
Dự luật yêu cầu Bộ Thương mại Mỹ xây dựng quy định trong 6 tháng, không chỉ để xác định vị trí chip mà còn hướng tới ngăn chip khởi động nếu không có giấy phép hợp lệ.
Cơ chế xác định vị trí hoạt động dựa trên tín hiệu truyền tới máy chủ an toàn và đo độ trễ thời gian (dựa trên tốc độ ánh sáng) – đủ để xác định chip đang ở quốc gia nào.
DeepSeek của Trung Quốc – một mô hình AI vượt trội – được cho là sử dụng chip Nvidia bị cấm, gây lo ngại và thôi thúc phản ứng chính sách từ Quốc hội Mỹ.
Google được cho là đã theo dõi chip AI nội bộ để đảm bảo an ninh, xác nhận công nghệ theo dõi là khả thi và đã được áp dụng.
Dự luật nhận được ủng hộ lưỡng đảng, trong đó Hạ nghị sĩ Raja Krishnamoorthi và John Moolenaar đều ủng hộ tích hợp công nghệ định vị trong chip AI.
Hiện tại, Cục Công nghiệp và An ninh (BIS) không thể biết chip nào đang ở đâu – công nghệ định vị sẽ giúp xác định chip đáng điều tra và chip an toàn.
Tính năng chặn khởi động chip nếu không hợp lệ sẽ phức tạp hơn về kỹ thuật, nhưng Foster cho biết đã đến lúc bắt đầu thảo luận với nhà sản xuất.
Một vụ án tại Singapore đã truy tố 3 người liên quan đến máy chủ nghi chứa chip Nvidia bị lén xuất khẩu, cho thấy tình trạng buôn lậu chip là có thật và có hệ thống.
Nvidia hiện từ chối bình luận, nhưng áp lực đang tăng khi doanh thu từ Trung Quốc đạt tới 17 tỷ USD, chiếm 13% tổng doanh thu của công ty.

📌 Hạ nghị sĩ Mỹ Bill Foster sắp đề xuất dự luật yêu cầu theo dõi vị trí và kiểm soát khởi động chip AI sau khi bán, nhằm ngăn chặn buôn lậu sang Trung Quốc – nơi mô hình như DeepSeek đang sử dụng chip bị cấm để tạo ra AI vượt trội. Công nghệ đã tồn tại, và giờ là lúc biến nó thành luật.

https://www.reuters.com/world/us/us-lawmaker-targets-nvidia-chip-smuggling-china-with-new-bill-2025-05-05/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-05-07 06:29:38

Kỷ nguyên AI buộc doanh nghiệp “đập đi xây lại” hạ tầng CNTT: Bạn đã sẵn sàng chưa?

Các hệ thống hạ tầng CNTT hiện tại không còn đủ sức đáp ứng khối lượng và tốc độ của AI – từ dữ liệu lớn đến xử lý mô hình phức tạp.
Theo báo cáo IT Trends Q1 2025 của JumpCloud, 42% doanh nghiệp ưu tiên chi cho AI, 40% cho hạ tầng đám mây, và bảo mật là số 1 – cho thấy sự hội tụ quan trọng giữa 3 yếu tố này.
AI cần kiến trúc linh hoạt, có thể mở rộng, đặc biệt là đám mây-native để xử lý khối lượng tính toán và luồng dữ liệu khổng lồ.
Hạ tầng cũ, đặc biệt là on-premises không linh hoạt, là rào cản lớn: hạn chế mở rộng, dữ liệu cứng nhắc và khó đáp ứng các yêu cầu AI hiện đại.
Mô hình hybrid đang trở thành lựa chọn chính: dữ liệu nhạy cảm và ứng dụng yêu cầu độ trễ thấp vẫn duy trì on-prem, trong khi các tác vụ AI được chuyển lên đám mây.
Một bước chuyển điển hình là nâng cấp các nền tảng cơ bản như danh tính (identity), thư mục (directory) lên môi trường đám mây để hỗ trợ AI ở quy mô lớn.
Khung bảo mật và tuân thủ truyền thống không còn đủ: AI mang lại rủi ro mới như manipulation, nhiễm độc dữ liệu (data poisoning), và thiên lệch thuật toán.
48% đội ngũ IT tăng đầu tư bảo mật, nhưng thách thức thực sự là cập nhật khung bảo mật để phù hợp với rủi ro đặc thù của AI, bao gồm kiểm soát truy cập động và theo dõi mô hình.
Tích hợp và hợp nhất hệ thống quản lý danh tính, thiết bị, truy cập trở thành yêu cầu bắt buộc để phát hiện nhanh bất thường, áp chính sách và giữ kiểm soát toàn cục.
AI cần “nền móng thông minh” – nếu hệ thống lõi vẫn hoạt động rời rạc, AI không thể phát huy tối đa giá trị tự động hóa và ra quyết định.
Việc tái xây dựng stack IT không phải là phá bỏ toàn bộ, mà là tiến hóa – loại bỏ rào cản cũ, kết hợp linh hoạt hạ tầng mới, và xây nền tảng bảo mật phù hợp với AI quy mô lớn.

📌 Hạ tầng IT truyền thống không còn phù hợp với AI hiện đại. Doanh nghiệp cần chuyển sang hạ tầng hybrid linh hoạt, hợp nhất hệ thống bảo mật và danh tính, và thiết kế lại toàn bộ stack IT để sẵn sàng cho AI ở quy mô doanh nghiệp. Với 42% ưu tiên AI và 40% chuyển đổi đám mây, cuộc tái kiến trúc đang diễn ra mạnh mẽ trên toàn cầu.

https://www.cio.com/article/3976633/the-new-it-stack-rebuilding-infrastructure-for-an-ai-first-world.html?amp=1

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-05-02 02:01:33

Nvidia dự báo mọi doanh nghiệp Mỹ sẽ cần “nhà máy AI”, thúc đẩy sản xuất AI ngay tại Mỹ

CEO Nvidia Jensen Huang tuyên bố mọi công ty Mỹ trong tương lai sẽ cần hoặc trở thành “nhà máy AI”, vừa sản xuất hàng hóa vừa tạo ra AI, từ đó thúc đẩy tạo việc làm kỹ năng cao tại Mỹ.
Khái niệm “nhà máy AI” mà Nvidia quảng bá là tổ hợp gồm chip, phần mềm, thiết kế, hạ tầng mạng để tiếp nhận dữ liệu, xuất ra trí tuệ nhân tạo - ví như “xưởng” cho các mô hình AI.
Nvidia hưởng lợi khi “nhà máy AI” mở rộng, vì hãng chi phối động cơ AI thông qua chip và hạ tầng, với ví von “điện vào, token ra” (token là đơn vị dữ liệu AI tạo ra).
Phát biểu tại sự kiện Hill and Valley Forum ở Washington D.C (30.04.2025), Huang cũng nhấn mạnh ý nghĩa của làn sóng xây trung tâm dữ liệu AI tại Mỹ, giúp tạo ra việc làm trong xây dựng, thép, IT và mạng.
Nvidia vừa công bố sẽ sản xuất toàn bộ siêu máy tính AI ngay tại Mỹ, lần đầu tiên thiết bị này hoàn toàn “nội địa hóa”.
Huang gửi thông điệp: Nếu không thuần thục sản xuất trong nước, nước Mỹ sẽ bỏ lỡ ngành công nghiệp khổng lồ của tương lai.
Giữa bối cảnh cạnh tranh Mỹ-Trung, một số dòng chip AI cao cấp của Nvidia chịu kiểm soát xuất khẩu, chính phủ Mỹ yêu cầu giấy phép xuất khẩu đối với loại chip này (Nvidia từng cảnh báo thiệt hại 5,5 tỷ USD vì quy định mới).
Huang tránh trả lời chi tiết về các biện pháp kiểm soát xuất khẩu, nhưng kêu gọi chính phủ Mỹ “tăng tốc và thúc đẩy” ngành công nghiệp AI nội địa.
Ngày 01.05.2025, Huang dự kiến dự họp kín với Ủy ban Ngoại giao Hạ viện Mỹ về thực thi các biện pháp kiểm soát xuất khẩu công nghệ.
Jacob Helberg, đồng sáng lập sự kiện, là người chống Trung Quốc mạnh mẽ, cảnh báo các doanh nghiệp Mỹ chuẩn bị sẵn sàng cho các kịch bản căng thẳng leo thang.

📌 Jensen Huang (CEO Nvidia) nhấn mạnh mọi doanh nghiệp Mỹ sẽ cần nhà máy AI, thúc đẩy tạo việc làm kỹ năng cao, nhắm đến sóng trung tâm dữ liệu, sản xuất siêu máy tính AI 100% tại Mỹ. Ngành chip chịu tác động nặng trước quy định kiểm soát xuất khẩu (ước tính thiệt hại 5,5 tỷ USD).

https://www.wsj.com/articles/nvidia-ceo-says-all-companies-will-need-ai-factories-touts-creation-of-american-jobs-33e07998

#WSJ

CEO Nvidia nói rằng tất cả các công ty sẽ cần 'Nhà máy AI,' ca ngợi việc tạo ra việc làm cho người Mỹ

Jensen Huang cho biết sự gia tăng trung tâm dữ liệu là thiết yếu cho các công việc có kỹ năng khi công ty của ông theo đuổi kế hoạch sản xuất ở Mỹ

Tác giả
Belle Lin
30 tháng 4, 2025 6:44 chiều ET

Jensen Huang, CEO của Nvidia, tại Diễn đàn Hill and Valley ngày 30 tháng 4 ở Washington, D.C.

WASHINGTON—CEO Nvidia Jensen Huang cho biết tất cả các công ty Mỹ cuối cùng sẽ cần hoặc trở thành nhà máy trí tuệ nhân tạo—hoặc các đơn vị sản xuất cả hàng hóa và AI—và sẽ tạo ra các công việc có kỹ năng ở Mỹ trong quá trình này.

"Giống như chúng ta tạo ra xe hơi vật lý ngày nay, hoặc bất cứ thứ gì vật lý trong tương lai, sẽ có một phiên bản kỹ thuật số của nó," Huang nói với The Wall Street Journal vào thứ Tư. "Vì vậy bạn cần một nhà máy AI để tạo ra mô hình AI chạy trong xe."

Một nhà máy AI—cũng có thể được mô tả như một cửa hàng tất cả trong một về chip, phần mềm, thiết kế và cơ sở hạ tầng mạng được thiết kế cho AI—là một khái niệm mà Nvidia đã quảng bá tại các sự kiện trước đây như một cơ sở tiếp nhận dữ liệu và tạo ra trí thông minh.

Nvidia hưởng lợi từ sự phát triển của các nhà máy AI này vì gã khổng lồ chip là "động cơ" đằng sau cơ sở hạ tầng AI, Huang nói. Điện năng đi vào nhà máy và token đi ra, ông nói, đề cập đến các đơn vị dữ liệu nhỏ mà các mô hình AI phun ra.

Bình luận của CEO Nvidia được đưa ra trong Diễn đàn Hill and Valley, một cuộc tụ họp của giới tinh hoa Thung lũng Silicon và các nhà hoạch định chính sách do Jacob Helberg đồng sáng lập, người được Tổng thống Trump chọn làm thứ trưởng ngoại giao phụ trách tăng trưởng kinh tế, năng lượng và môi trường.

Helberg nổi tiếng với lập trường cứng rắn về Trung Quốc và đã cảnh báo rằng các công ty phải chuẩn bị chuỗi cung ứng của mình cho khả năng leo thang căng thẳng giữa Mỹ và Trung Quốc.

Các chip AI tiên tiến của Nvidia, đã giúp kích hoạt bùng nổ AI, vẫn nằm trong tầm ngắm của Washington về việc bán cho Trung Quốc. Chính phủ Mỹ đầu tháng này cho biết sẽ yêu cầu giấy phép xuất khẩu đối với một số chip do Nvidia và đối thủ AMD sản xuất, khiến gã khổng lồ chip cảnh báo sẽ chịu khoản phí 5.5 tỷ đô la.

Huang vào thứ Tư từ chối trả lời các câu hỏi cụ thể về kiểm soát xuất khẩu chip của chính phủ, nói rằng các nhà hoạch định chính sách "cần nhận ra rằng chúng ta nên đang đẩy nhanh, hỗ trợ và thúc đẩy ngành công nghiệp AI Mỹ trên toàn thế giới."

Huang sẽ thảo luận về các hoạt động kinh doanh của Nvidia và tuân thủ kiểm soát xuất khẩu của Mỹ tại một bàn tròn kín do Ủy ban Đối ngoại Hạ viện tổ chức vào thứ Năm, những người quen thuộc với vấn đề cho biết. Bàn tròn là một phần trong loạt cuộc trò chuyện mà các nhà lập pháp đang có với các chuyên gia về kiểm soát xuất khẩu.

Phát triển trên ý tưởng rằng các nhà máy AI sẽ trở nên phổ biến đối với các công ty Mỹ, Huang cũng cho biết sự bùng nổ xây dựng trung tâm dữ liệu Mỹ sẽ tạo ra các công việc có kỹ năng trong các lĩnh vực bao gồm xây dựng, chế tạo thép, và công nghệ thông tin và mạng.

"Đất nước chúng ta cần thừa nhận rằng nghề thủ công là công việc đáng kính trọng, và điều đó cần thiết để xây dựng một quốc gia," ông nói.

Nvidia tháng này thông báo rằng sẽ bắt đầu sản xuất siêu máy tính AI hoàn toàn ở Mỹ—đánh dấu lần đầu tiên các thiết bị như vậy sẽ được sản xuất hoàn toàn trong nước, công ty cho biết.

"Tôi rất vui mừng khi chính quyền thực sự khuyến khích hỗ trợ ngành công nghiệp với sản xuất trong nước," Huang nói vào thứ Tư. "Nếu chúng ta không giỏi trong sản xuất, chúng ta sẽ bỏ lại phía sau một ngành công nghiệp khổng lồ."

Amrith Ramkumar đã đóng góp cho bài viết này.

Viết thư cho Belle Lin tại [email protected]

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute AI pháp lý-quản trị-chủ quyền 2025-05-01 08:59:18

Anthropic bất ngờ ủng hộ siết kiểm soát chip AI Mỹ, đề xuất cắt hạn mức chip với nhiều quốc gia

Anthropic hoàn toàn ủng hộ khung kiểm soát xuất khẩu chip AI mà Bộ Thương mại Hoa Kỳ dự kiến áp dụng từ 15.05.2025.
Khung kiểm soát, do tổng thống Joe Biden đề xuất tháng 1.2025, phân các quốc gia thành 3 nhóm:
- Tier 1 (Nhật Bản, Hàn Quốc): không bị hạn chế xuất khẩu chip AI
- Tier 2 (Mexico, Bồ Đào Nha): lần đầu bị áp hạn mức số lượng chip AI được mua
- Tier 3 (Trung Quốc, Nga): bị siết chặt thêm so với các kiểm soát trước đây
Nvidia từng chỉ trích chính sách mới là chưa từng có tiền lệ, cho rằng sẽ làm chậm đổi mới toàn cầu, nhưng Anthropic lại công khai đối lập.
Anthropic đề xuất giảm thêm số lượng chip AI mà các nước Tier 2 có thể mua trước khi bị duyệt lại, nhằm hạn chế khả năng tuồn chip ra ngoài hoặc vượt kiểm soát.
Anthropic khuyến nghị khuyến khích các nước Tier 2 mua chip AI qua các thỏa thuận liên chính phủ để Nhà Trắng tăng kiểm soát và giảm nguy cơ buôn lậu.
Công ty nhấn mạnh chính phủ Mỹ nên tăng tài trợ để giám sát, thực thi kiểm soát xuất khẩu chip AI hiệu quả hơn.
CEO Dario Amodei của Anthropic vốn là một trong các lãnh đạo AI chủ chốt tại Mỹ tích cực vận động siết kiểm soát chip AI, từng đăng bài trên Wall Street Journal về nguy cơ an ninh.
Chưa có phản hồi từ phía Anthropic về các câu hỏi mở rộng; chính sách dự kiến sẽ tác động mạnh đến dòng chảy chip AI toàn cầu kể từ giữa tháng 5.2025.

📌 Anthropic ủng hộ mạnh kiểm soát xuất khẩu chip AI, đề xuất giảm hạn mức chip AI cho các nước Tier 2, tăng hợp tác liên chính phủ và tài trợ kiểm soát, giúp Mỹ củng cố vị thế AI trước Trung Quốc. Các thay đổi dự kiến gây ảnh hưởng lớn từ 15.05.2025.

https://techcrunch.com/2025/04/30/anthropic-suggests-tweaks-to-proposed-u-s-ai-chip-export-controls/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-04-30 16:49:19

Tìm hiểu chi tiết về CUDA core - trái tim của sức mạnh GPU Nvidia

CUDA core là đơn vị xử lý SIMD (Single Instruction, Multiple Data) bên trong card đồ họa Nvidia, hỗ trợ xử lý song song cho các tác vụ đồ họa, AI và tính toán dữ liệu lớn.
CUDA là nền tảng lập trình song song do Nvidia phát triển gần 20 năm trước, lần đầu ra mắt năm 2006 trên GeForce 8800 GTX với 128 CUDA core.
CUDA hỗ trợ nhiều ngôn ngữ như C, C++, Fortran, Python, Julia và tích hợp nhiều API lẫn framework, như Direct3D, OpenGL, OpenMP, OpenCL, OpenACC.
Số lượng CUDA core tăng nhanh qua từng thế hệ: RTX 4090 có 16.384 nhân, RTX 5090 đạt 21.760 nhân, đáp ứng cả gaming độ phân giải cao và các tác vụ chuyên sâu như học máy, render 3D, video encoding, mô phỏng khoa học.
CUDA core sử dụng mô hình SIMT (Single Instruction, Multiple Threads) cho phép hàng ngàn nhân cùng lúc xử lý các tác vụ giống nhau, tối ưu cho các công việc cần song song hóa mạnh.
CPU thường chỉ có 16-32 nhân (như Ryzen 9 9950X3D), trong khi GPU phổ thông đã có khoảng 3.000 CUDA core, giúp tăng tốc quá trình xử lý video, gaming, mô phỏng khoa học.
Khác biệt cơ bản: CPU core tối ưu cho xử lý tuần tự, độ trễ thấp; CUDA core tối ưu cho thông lượng, chia nhỏ công việc để song song hóa tối đa.
CUDA platform cung cấp thư viện phong phú, cộng đồng lập trình lớn, mở rộng ứng dụng AI, đồ họa, xử lý ảnh, khoa học tính toán.
Card đồ họa AMD không dùng CUDA core mà dùng Stream Processor với nguyên lý tương tự, song không thể so sánh trực tiếp số lượng nhân giữa hai hãng.
Từ 2007, CUDA Toolkit liên tục nâng cấp (hiện ở bản 12), ưu tiên cho GPU Nvidia dòng H100, A100 phục vụ trung tâm dữ liệu, siêu máy tính.

📌 Hiện nay, GPU Nvidia trang bị từ vài nghìn tới hơn 20.000 CUDA core, là chìa khóa thúc đẩy hiệu năng gaming, AI, xử lý video, khoa học dữ liệu và giúp Nvidia duy trì vị thế dẫn đầu công nghệ GPU. CUDA core và nền tảng CUDA đã góp phần cách mạng hóa khả năng tính toán song song của máy tính hiện đại.

https://www.techradar.com/computing/gpu/what-is-a-cuda-core

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-04-29 11:21:05

McKinsey: Năm 2030, toàn cầu cần khoảng 6.700 tỷ USD cho trung tâm dữ liệu, riêng phục vụ AI chiếm 5.200 tỷ USD

AI tạo sinh đang thúc đẩy nhu cầu tính toán cực lớn, buộc doanh nghiệp phải đầu tư hàng nghìn tỷ USD vào hạ tầng trung tâm dữ liệu.
Dự báo đến năm 2030, toàn cầu cần khoảng 6.700 tỷ USD cho trung tâm dữ liệu, riêng phục vụ AI chiếm 5.200 tỷ USD, còn lại 1.500 tỷ USD cho các ứng dụng IT truyền thống.
Nhu cầu trung tâm dữ liệu có thể tăng gần gấp ba vào năm 2030, với khoảng 70% đến từ AI.
Ba kịch bản đầu tư đến năm 2030: thấp nhất 3.700 tỷ USD (78 GW công suất), trung bình 5.200 tỷ USD (125 GW), cao nhất 7.900 tỷ USD (205 GW).
60% vốn đầu tư (3.100 tỷ USD) dành cho công ty bán dẫn, phần cứng; 25% (1.300 tỷ USD) cho năng lượng, làm mát; 15% (800 tỷ USD) cho xây dựng, phát triển mặt bằng.
Các “builder” (nhà phát triển, xây dựng) đối mặt thiếu nhân lực, hạn chế vị trí; giải pháp là thiết kế mô-đun, lắp ráp ngoài công trường.
“Energizer” (công ty điện, làm mát) đầu tư mạnh vào năng lượng sạch, dự kiến năng lượng tái tạo chiếm 45-50% vào năm 2030, tăng từ mức 33% hiện nay.
“Technology developers and designers” (công ty bán dẫn, phần cứng) chi phối nguồn cung chip, đối mặt rủi ro tắc nghẽn, cần mở rộng sản xuất và đa dạng hóa chuỗi cung ứng.
“Operators” (nhà vận hành trung tâm dữ liệu) phải tối ưu hiệu quả năng lượng, đầu tư giải pháp làm mát, phát triển AI tiết kiệm tài nguyên.
“AI architects” (nhà phát triển mô hình AI) đối mặt chi phí inference tăng vọt, giải pháp là tối ưu kiến trúc, áp dụng kỹ thuật sparse activation, distillation.
Rủi ro lớn: gián đoạn công nghệ, tắc nghẽn chuỗi cung ứng, căng thẳng địa chính trị, khó dự báo ROI khiến CEO ngần ngại đầu tư tối đa.
Để vượt lên, doanh nghiệp cần dự báo nhu cầu sớm, đầu tư công nghệ tiết kiệm năng lượng, xây dựng chuỗi cung ứng linh hoạt và chọn vị trí tối ưu.

📌 Đầu tư cho trung tâm dữ liệu AI toàn cầu đến năm 2030 dự kiến lên tới gần 7.000 tỷ USD, trong đó riêng AI chiếm 5.200 tỷ USD. Ba nhóm hưởng lợi lớn là công ty bán dẫn, năng lượng và xây dựng, nhưng phải đối mặt rủi ro thiếu nguồn cung, công nghệ biến động và ROI khó lường. Ai dự báo, tối ưu và đầu tư linh hoạt sẽ dẫn đầu cuộc đua AI.

https://www.mckinsey.com/industries/technology-media-and-telecommunications/our-insights/the-cost-of-compute-a-7-trillion-dollar-race-to-scale-data-centers

#McKinsey

Chi phí tính toán: Cuộc đua 7.000 tỷ đô la để mở rộng quy mô trung tâm dữ liệu

Ngày 28 tháng 4, 2025 | Bài viết

AI đang thúc đẩy nhu cầu cao về năng lực tính toán, khiến các công ty đầu tư hàng tỷ đô la vào cơ sở hạ tầng. Nhưng với nhu cầu tương lai không chắc chắn, các nhà đầu tư cần đưa ra quyết định có tính toán.

Trong bối cảnh bùng nổ AI, sức mạnh tính toán đang nổi lên như một trong những nguồn tài nguyên quan trọng nhất của thập kỷ này. Tại các trung tâm dữ liệu trên toàn cầu, hàng triệu máy chủ hoạt động 24/7 để xử lý các mô hình nền tảng và ứng dụng học máy làm nền tảng cho AI. Phần cứng, bộ xử lý, bộ nhớ, lưu trữ và năng lượng cần thiết để vận hành các trung tâm dữ liệu này được gọi chung là sức mạnh tính toán—và nhu cầu về nó là không thể thỏa mãn.

Nghiên cứu của chúng tôi cho thấy đến năm 2030, các trung tâm dữ liệu dự kiến sẽ cần 6.700 tỷ đô la trên toàn cầu để theo kịp nhu cầu về sức mạnh tính toán. Các trung tâm dữ liệu được trang bị để xử lý tải AI dự kiến sẽ cần 5.200 tỷ đô la chi phí đầu tư, trong khi các trung tâm phục vụ ứng dụng CNTT truyền thống dự kiến cần 1.500 tỷ đô la chi phí đầu tư (xem sidebar "Còn các tải công việc không phải AI thì sao?"). Nhìn chung, đó là gần 7.000 tỷ đô la chi phí vốn cần thiết vào năm 2030—một con số đáng kinh ngạc theo bất kỳ thước đo nào.

Side bar: Còn các tải công việc không phải AI thì sao?

Trong khi các tải công việc AI chiếm ưu thế trong cuộc trò chuyện, các tải xử lý không phải AI vẫn chiếm một phần đáng kể hoạt động trung tâm dữ liệu. Những tải này bao gồm các tác vụ CNTT doanh nghiệp truyền thống như lưu trữ web, hệ thống hoạch định tài nguyên doanh nghiệp, email và lưu trữ tệp. Các tải không phải AI ít yêu cầu tính toán cao và có thể hoạt động hiệu quả trên các đơn vị xử lý trung tâm thay vì các đơn vị xử lý đồ họa chuyên biệt hoặc bộ tăng tốc AI mà tải công việc AI đòi hỏi. Chúng cũng thường có mô hình sử dụng dễ dự đoán hơn và mật độ năng lượng thấp hơn, cho phép yêu cầu làm mát và năng lượng ít đòi hỏi hơn. Kết quả là, các trung tâm dữ liệu tập trung vào xử lý không phải AI thường có nhu cầu cơ sở hạ tầng, cường độ vốn và cân nhắc hoạt động khác so với những trung tâm được tối ưu hóa cho AI.

Còn các tải công việc không phải AI thì sao?

Để đáp ứng nhu cầu này, các công ty trong chuỗi giá trị sức mạnh tính toán phải cân bằng giữa việc triển khai vốn nhanh chóng và làm điều đó một cách thận trọng. Để cải thiện khả năng đầu tư trung tâm dữ liệu mang lại lợi nhuận cao, các công ty có thể thực hiện các dự án theo từng giai đoạn, đánh giá ROI ở mỗi bước. Tuy nhiên, thiếu rõ ràng về nhu cầu tương lai khiến các tính toán đầu tư chính xác trở nên khó khăn.

Chuỗi giá trị sức mạnh tính toán rất phức tạp—từ các nhà phát triển bất động sản xây dựng trung tâm dữ liệu đến các công ty tiện ích cung cấp năng lượng, đến các công ty bán dẫn sản xuất chip đến các nhà cung cấp điện toán đám mây lớn lưu trữ hàng nghìn tỷ terabyte dữ liệu. Các lãnh đạo trong chuỗi giá trị này biết rằng họ phải đầu tư vào sức mạnh tính toán để đẩy nhanh tăng trưởng AI. Nhưng thách thức của họ rất lớn: quyết định phân bổ bao nhiêu vốn cho dự án nào, tất cả trong khi vẫn không chắc chắn về cách tăng trưởng và phát triển trong tương lai của AI sẽ ảnh hưởng đến nhu cầu sức mạnh tính toán. Các nhà cung cấp điện toán đám mây lớn sẽ tiếp tục gánh vác gánh nặng chi phí, hay các doanh nghiệp, chính phủ và tổ chức tài chính sẽ tham gia với các mô hình tài chính mới? Nhu cầu về trung tâm dữ liệu sẽ tăng lên trong bối cảnh tiếp tục gia tăng sử dụng AI, hay sẽ giảm khi tiến bộ công nghệ làm cho AI ít tốn kém hơn về mặt tính toán?

Một điều chắc chắn là: Cổ phần đang rất cao. Đầu tư quá mức vào cơ sở hạ tầng trung tâm dữ liệu có nguy cơ làm mắc kẹt tài sản, trong khi đầu tư không đủ đồng nghĩa với việc tụt hậu. Bài viết này, dựa trên nghiên cứu và phân tích của McKinsey, cung cấp cho các công ty trong chuỗi giá trị sức mạnh tính toán tổng quan về bối cảnh đầu tư trong năm năm tới. Mặc dù có sự nghiêm túc đằng sau các dự báo này, chúng tôi thừa nhận rằng AI là một lĩnh vực đang phát triển một cách triệt để. Phân tích của chúng tôi được xây dựng trên các giả thuyết được nghiên cứu kỹ lưỡng, nhưng có những điều không chắc chắn quan trọng chưa thể lượng hóa được.

Dự đoán đường cong nhu cầu sức mạnh tính toán

Để quyết định đầu tư bao nhiêu vào sức mạnh tính toán, các công ty trước tiên nên dự báo chính xác nhu cầu trong tương lai—một nhiệm vụ đầy thách thức khi ngành AI đang thay đổi nhanh chóng. Nghiên cứu của chúng tôi cho thấy nhu cầu toàn cầu về năng lực trung tâm dữ liệu có thể tăng gần gấp 3 lần vào năm 2030, với khoảng 70% nhu cầu đó đến từ tải công việc AI (Biểu đồ 1). Tuy nhiên, dự báo này phụ thuộc vào 2 yếu tố không chắc chắn:

Các trường hợp sử dụng AI. Giá trị trong AI nằm ở tầng ứng dụng—cách các doanh nghiệp biến AI thành tác động kinh doanh thực tế. Nếu các công ty không tạo ra giá trị có ý nghĩa từ AI, nhu cầu về sức mạnh tính toán có thể không đạt được kỳ vọng. Ngược lại, các ứng dụng AI đột phá có thể thúc đẩy nhu cầu lớn hơn nhiều so với dự báo hiện tại.

Chu kỳ đổi mới nhanh và gián đoạn. Tiến bộ liên tục trong công nghệ AI, như bộ xử lý, kiến trúc mô hình ngôn ngữ lớn (LLM) và tiêu thụ năng lượng, có thể nâng cao đáng kể hiệu quả. Ví dụ, vào tháng 2 năm 2025, công ty LLM Trung Quốc DeepSeek báo cáo rằng mô hình V3 của họ đạt được những cải tiến đáng kể về hiệu quả đào tạo và suy luận, đáng chú ý là giảm chi phí đào tạo khoảng 18 lần và chi phí suy luận khoảng 36 lần so với GPT-4o. Tuy nhiên, phân tích sơ bộ cho thấy những loại lợi ích hiệu quả này có thể sẽ bị bù đắp bởi việc tăng thử nghiệm và đào tạo trong thị trường AI rộng hơn. Kết quả là, lợi ích hiệu quả có thể không ảnh hưởng đáng kể đến nhu cầu sức mạnh tính toán tổng thể trong dài hạn.

Biểu đồ 1 Cả tải công việc AI và không phải AI sẽ là yếu tố thúc đẩy chính cho tăng trưởng nhu cầu năng lực trung tâm dữ liệu toàn cầu đến năm 2030.

Chỉ riêng nhu cầu AI sẽ cần 5.200 tỷ đô la đầu tư

Quy mô đầu tư

Để hiểu quy mô đầu tư hàng nghìn tỷ đô la cần thiết vào năm 2030, hãy xem xét những thống kê không liên quan sau đây minh họa quy mô vốn cần thiết:

Chúng tôi tính toán rằng các công ty trong chuỗi giá trị sức mạnh tính toán sẽ cần đầu tư 5.200 tỷ đô la vào trung tâm dữ liệu vào năm 2030 để đáp ứng nhu cầu AI toàn cầu. Chúng tôi dựa con số này trên phân tích mở rộng và các giả định chính, bao gồm dự báo 156 gigawatt (GW) nhu cầu năng lực trung tâm dữ liệu liên quan đến AI vào năm 2030, với 125 GW tăng thêm được bổ sung từ 2025 đến 2030. Con số 5.200 tỷ đô la này phản ánh quy mô đầu tư cần thiết để đáp ứng nhu cầu ngày càng tăng về sức mạnh tính toán AI—một cam kết vốn đáng kể nhấn mạnh tầm quan trọng của thách thức phía trước (xem sidebar "Quy mô đầu tư").

Sidebar "Quy mô đầu tư":

Lao động. 500 tỷ đô la chi phí lao động tương đương với khoảng 12 tỷ giờ lao động (6 triệu người làm việc toàn thời gian trong cả năm).

Cáp quang. 150 tỷ đô la cáp quang tương đương với việc lắp đặt 3 triệu dặm cáp quang—đủ để bao quanh Trái Đất 120 lần.

Sản xuất điện. 300 tỷ đô la sản xuất điện tương đương với việc bổ sung 150 đến 200 gigawatt khí đốt, đủ để cung cấp điện cho 150 triệu hộ gia đình trong một năm—nhiều hơn tổng số hộ gia đình ở Hoa Kỳ.

Trong bối cảnh không chắc chắn về nhu cầu tương lai đối với sức mạnh tính toán, chúng tôi đã tạo ra 3 kịch bản đầu tư từ nhu cầu hạn chế đến tăng tốc (Biểu đồ 2). Trong kịch bản đầu tiên trong 3 kịch bản của chúng tôi, tăng trưởng tăng tốc đáng kể và 205 GW năng lực trung tâm dữ liệu liên quan đến AI tăng thêm được bổ sung từ 2025 đến 2030. Điều này sẽ đòi hỏi ước tính 7.900 tỷ đô la chi phí vốn. Kịch bản thứ hai là kịch bản chúng tôi sử dụng trong bài viết này: Nhu cầu tăng, nhưng không nhiều như trong kịch bản đầu tiên, và chi phí vốn dự kiến là 5.200 tỷ đô la. Trong kịch bản thứ ba của chúng tôi, trong đó nhu cầu bị hạn chế hơn, với 78 GW tăng thêm được bổ sung trong 5 năm tới, tổng chi phí vốn là 3.700 tỷ đô la (xem sidebar "Phương pháp luận").

Side Bar: Phương pháp luận

Ước tính chi phí vốn trong bài viết này được lấy từ mô hình nhu cầu trung tâm dữ liệu độc quyền của McKinsey, dự báo năng lực trung tâm dữ liệu theo nhiều kịch bản hình thành từ các yếu tố như hạn chế cung ứng bán dẫn, áp dụng AI doanh nghiệp, cải tiến hiệu quả và thách thức quy định. Yêu cầu đầu tư được tính toán bằng cách chuyển đổi dự báo nhu cầu về năng lực gigawatt thành chi phí vốn trên các danh mục chi phí chính, bao gồm năng lượng (ví dụ: sản xuất, truyền tải), cơ sở hạ tầng trung tâm dữ liệu (ví dụ: điện, cơ khí, địa điểm, vỏ) và thiết bị CNTT (ví dụ: bộ tăng tốc AI, mạng, lưu trữ).

Biểu đồ 2 Đầu tư vốn để hỗ trợ nhu cầu năng lực trung tâm dữ liệu liên quan đến AI có thể dao động từ khoảng 3.000 tỷ đến 8.000 tỷ đô la vào năm 2030.

Trong bất kỳ kịch bản nào, đây là những con số đầu tư đáng kinh ngạc. Chúng được thúc đẩy bởi một số yếu tố:

Áp dụng hàng loạt AI tạo sinh. Các mô hình nền tảng làm nền tảng cho AI tạo sinh đòi hỏi nguồn lực sức mạnh tính toán đáng kể để đào tạo và vận hành. Cả tải công việc đào tạo và suy luận đều đóng góp vào tăng trưởng cơ sở hạ tầng, với suy luận dự kiến sẽ trở thành tải công việc chủ đạo vào năm 2030.

Tích hợp doanh nghiệp. Triển khai các ứng dụng được hỗ trợ bởi AI trên nhiều ngành—từ ô tô đến dịch vụ tài chính—đòi hỏi sức mạnh điện toán đám mây lớn. Khi các trường hợp sử dụng tăng lên, các ứng dụng AI sẽ trở nên tinh vi hơn, tích hợp các mô hình nền tảng chuyên biệt được điều chỉnh cho các lĩnh vực cụ thể.

Cuộc đua cơ sở hạ tầng cạnh tranh. Các nhà cung cấp điện toán đám mây lớn và doanh nghiệp đang đua nhau xây dựng năng lực AI độc quyền để giành lợi thế cạnh tranh, điều này thúc đẩy việc xây dựng ngày càng nhiều trung tâm dữ liệu. Những "nhà xây dựng" này (như được mô tả chi tiết hơn dưới đây) hy vọng giành được lợi thế cạnh tranh bằng cách đạt quy mô, tối ưu hóa trên các ngăn xếp công nghệ trung tâm dữ liệu và cuối cùng là giảm chi phí tính toán.

Ưu tiên địa chính trị. Các chính phủ đang đầu tư mạnh mẽ vào cơ sở hạ tầng AI để tăng cường an ninh, lãnh đạo kinh tế và độc lập công nghệ.

Đầu tư đang đi đâu?

Để đánh giá dự báo đầu tư 5.200 tỷ đô la cho cơ sở hạ tầng AI của chúng tôi, điều quan trọng cần lưu ý là phân tích của chúng tôi có thể đếm thiếu tổng đầu tư vốn cần thiết, vì ước tính của chúng tôi chỉ định lượng đầu tư vốn cho 3 trong 5 nguyên mẫu nhà đầu tư sức mạnh tính toán—nhà xây dựng, nhà cung cấp năng lượng và nhà phát triển và thiết kế công nghệ—trực tiếp tài trợ cơ sở hạ tầng và công nghệ nền tảng cần thiết cho tăng trưởng AI (xem sidebar "5 loại nhà đầu tư trung tâm dữ liệu"). Khoảng 15% (0,8 nghìn tỷ đô la) đầu tư sẽ chảy vào nhà xây dựng cho đất đai, vật liệu và phát triển địa điểm. 25% khác (1,3 nghìn tỷ đô la) sẽ được phân bổ cho nhà cung cấp năng lượng cho sản xuất và truyền tải điện, làm mát và thiết bị điện. Phần lớn nhất của đầu tư, 60% (3,1 nghìn tỷ đô la), sẽ dành cho nhà phát triển và thiết kế công nghệ, sản xuất chip và phần cứng máy tính cho trung tâm dữ liệu. Hai nguyên mẫu nhà đầu tư khác, nhà vận hành, như nhà cung cấp điện toán đám mây lớn và nhà cung cấp dịch vụ đặt chỗ, và kiến trúc sư AI, xây dựng mô hình và ứng dụng AI, cũng đầu tư vào sức mạnh tính toán, đặc biệt là trong các lĩnh vực như tự động hóa được AI hỗ trợ và phần mềm trung tâm dữ liệu. Nhưng việc định lượng đầu tư sức mạnh tính toán của họ là một thách thức vì nó trùng lặp với chi tiêu R&D rộng hơn của họ.

Side bar: 5 loại nhà đầu tư trung tâm dữ liệu

Khi AI thúc đẩy sự gia tăng nhu cầu sức mạnh tính toán, năm loại tổ chức đang dẫn đầu các khoản đầu tư vốn lớn cần thiết để mở rộng quy mô trung tâm dữ liệu:

Nhà xây dựng: nhà phát triển bất động sản, công ty thiết kế và xây dựng mở rộng và nâng cấp trung tâm dữ liệu, như Turner Construction và AECOM

Nhà cung cấp năng lượng: các công ty cung cấp điện và hệ thống làm mát thiết yếu cho hoạt động trung tâm dữ liệu, bao gồm các tiện ích như Duke Energy và Entergy và nhà cung cấp cơ sở hạ tầng và thiết bị như Schneider Electric và Vertiv

Nhà phát triển và thiết kế công nghệ: các công ty bán dẫn phát triển chip cung cấp năng lượng cho tải công việc AI, như NVIDIA và Intel, và nhà cung cấp phần cứng máy tính như Foxconn và Flex

Nhà vận hành: nhà cung cấp đám mây và công ty đặt chỗ sở hữu và vận hành trung tâm dữ liệu quy mô lớn, như Amazon Web Services, Google Cloud và Equinix

Kiến trúc sư AI: các công ty phát triển mô hình và cơ sở hạ tầng AI, bao gồm OpenAI và Anthropic

Mặc dù có những yêu cầu vốn dự kiến này, nghiên cứu của chúng tôi cho thấy mức đầu tư hiện tại kém hơn nhu cầu. Trong hàng chục cuộc phỏng vấn khách hàng, chúng tôi nhận thấy các CEO ngần ngại đầu tư vào năng lực sức mạnh tính toán ở mức tối đa vì họ có tầm nhìn hạn chế về nhu cầu tương lai. Sự không chắc chắn về việc liệu việc áp dụng AI sẽ tiếp tục tăng nhanh và thực tế là các dự án cơ sở hạ tầng có thời gian dẫn dắt dài khiến các công ty khó đưa ra quyết định đầu tư sáng suốt. Nhiều công ty không chắc liệu chi phí vốn lớn cho cơ sở hạ tầng AI ngày nay sẽ tạo ra ROI đo lường được trong tương lai. Vậy làm thế nào để các nhà lãnh đạo kinh doanh tự tin tiến hành đầu tư của họ? Bước đầu tiên, họ có thể xác định vị trí của tổ chức mình trong hệ sinh thái sức mạnh tính toán.

5 nguyên mẫu nhà đầu tư cơ sở hạ tầng AI

Ai là những nhà đầu tư đứng sau cuộc đua hàng nghìn tỷ đô la để tài trợ cho sức mạnh tính toán AI? Chúng tôi đã xác định năm nguyên mẫu nhà đầu tư chính, mỗi nguyên mẫu đang điều hướng những thách thức và cơ hội riêng biệt, và chi tiết họ có thể chi bao nhiêu trong năm năm tới.

1. Nhà xây dựng

Họ là ai: nhà phát triển bất động sản, công ty thiết kế và xây dựng mở rộng năng lực trung tâm dữ liệu Chi phí vốn tải công việc AI: 800 tỷ đô la Chi phí vốn tải công việc không phải AI: 100 tỷ đô la Đầu tư chính: thu mua đất đai và vật liệu, lao động có kỹ năng, phát triển địa điểm

Cơ hội. Nhà xây dựng tối ưu hóa lựa chọn địa điểm có thể bảo đảm vị trí đắc địa, giảm thời gian xây dựng và tích hợp phản hồi hoạt động sớm, đảm bảo triển khai nhanh hơn và hiệu quả trung tâm dữ liệu cao hơn.

Thách thức. Thiếu hụt lao động có thể ảnh hưởng đến sự sẵn có của kỹ thuật viên và công nhân xây dựng, trong khi hạn chế vị trí có thể giới hạn các lựa chọn lựa chọn địa điểm. Đồng thời, mật độ điện giá đỡ tăng có thể tạo ra thách thức về không gian và làm mát.

Giải pháp. Nhà xây dựng có tầm nhìn xa có thể tìm giải pháp cho các thách thức cốt lõi, thêm sự chắc chắn vào quyết định đầu tư của họ. Ví dụ, một số đang giải quyết vấn đề thiếu lao động bằng cách áp dụng thiết kế mô-đun hóa giúp hợp lý hóa quy trình xây dựng, chẳng hạn như xây dựng các thành phần lớn bên ngoài công trường có thể được lắp ráp tại chỗ.

2. Nhà cung cấp năng lượng

Họ là ai: tiện ích, nhà cung cấp năng lượng, nhà sản xuất thiết bị làm mát/điện và nhà điều hành viễn thông xây dựng cơ sở hạ tầng điện và kết nối cho trung tâm dữ liệu AI Chi phí vốn tải công việc AI: 1.300 tỷ đô la Chi phí vốn tải công việc không phải AI: 200 tỷ đô la Đầu tư chính: sản xuất điện (nhà máy, đường dây truyền tải), giải pháp làm mát (làm mát bằng không khí, làm mát bằng chất lỏng trực tiếp đến chip, làm mát bằng ngâm), cơ sở hạ tầng điện (máy biến áp, máy phát điện), kết nối mạng (cáp quang, cáp)

Cơ hội. Nhà cung cấp năng lượng mở rộng quy mô cơ sở hạ tầng điện và đổi mới trong giải pháp năng lượng bền vững sẽ có vị thế tốt nhất để hưởng lợi từ nhu cầu năng lượng ngày càng tăng của các nhà cung cấp điện toán đám mây lớn.

Thách thức. Cung cấp điện cho trung tâm dữ liệu có thể bị đình trệ do điểm yếu lưới điện hiện có và giải quyết thách thức quản lý nhiệt từ mật độ bộ xử lý tăng vẫn là một trở ngại. Nhà cung cấp năng lượng cũng phải đối mặt với yêu cầu chuyển đổi năng lượng sạch và quy trình phê duyệt kết nối lưới điện kéo dài.

Giải pháp. Với hơn 1 nghìn tỷ đô la đầu tư, nhà cung cấp năng lượng đang tìm cách cung cấp điện đáng tin cậy trong khi thúc đẩy ROI. Họ đang đầu tư đáng kể vào công nghệ sản xuất điện mới nổi—bao gồm hạt nhân, địa nhiệt, thu giữ và lưu trữ carbon, và lưu trữ năng lượng dài hạn. Họ cũng đang tăng gấp đôi nỗ lực đưa càng nhiều công suất lên mạng càng nhanh càng tốt trên cả nguồn tái tạo và cơ sở hạ tầng năng lượng truyền thống, như khí đốt và nhiên liệu hóa thạch. Điều thay đổi bây giờ là quy mô của nhu cầu đó, mang lại sự cấp bách mới để xây dựng công suất điện với tốc độ chưa từng có. Khi nhu cầu—đặc biệt là đối với năng lượng sạch—tăng vọt, sản xuất điện dự kiến sẽ tăng trưởng nhanh chóng, với năng lượng tái tạo dự kiến chiếm khoảng 45 đến 50% hỗn hợp năng lượng vào năm 2030, tăng từ khoảng một phần ba hiện nay.

3. Nhà phát triển và thiết kế công nghệ

Họ là ai: các công ty bán dẫn và nhà cung cấp CNTT sản xuất chip và phần cứng máy tính cho trung tâm dữ liệu Chi phí vốn tải công việc AI: 3.100 tỷ đô la Chi phí vốn tải công việc không phải AI: 1.100 tỷ đô la Đầu tư chính: GPU, CPU, bộ nhớ, máy chủ và phần cứng giá đỡ

Cơ hội. Nhà phát triển và thiết kế công nghệ đầu tư vào công nghệ sẵn sàng cho tương lai có khả năng mở rộng được hỗ trợ bởi tầm nhìn nhu cầu rõ ràng có thể giành được lợi thế cạnh tranh trong điện toán AI.

Thách thức. Một số lượng nhỏ các công ty bán dẫn kiểm soát nguồn cung thị trường, làm suy yếu cạnh tranh. Xây dựng công suất vẫn không đủ để đáp ứng nhu cầu hiện tại, trong khi đồng thời, sự thay đổi trong phương pháp đào tạo mô hình AI và tải công việc khiến khó dự đoán nhu cầu tương lai cho các chip cụ thể.

Giải pháp. Nhà phát triển và thiết kế công nghệ có nhiều lợi ích nhất trong cuộc đua sức mạnh tính toán vì họ là những người cung cấp bộ xử lý và phần cứng thực hiện việc tính toán thực tế. Nhu cầu về sản phẩm của họ hiện đang cao, nhưng nhu cầu đầu tư của họ cũng lớn nhất—hơn 3 nghìn tỷ đô la trong năm năm tới. Một số lượng nhỏ các công ty bán dẫn có ảnh hưởng không tương xứng đến nguồn cung ngành, khiến họ trở thành điểm nghẽn tiềm tàng trong tăng trưởng sức mạnh tính toán. Nhà phát triển và thiết kế công nghệ có thể giảm thiểu rủi ro này bằng cách mở rộng công suất sản xuất và đa dạng hóa chuỗi cung ứng để ngăn chặn tắc nghẽn.

4. Nhà vận hành

Họ là ai: nhà cung cấp điện toán đám mây lớn, nhà cung cấp dịch vụ đặt chỗ, nền tảng GPU-dưới dạng dịch vụ và doanh nghiệp tối ưu hóa tài nguyên điện toán của họ bằng cách cải thiện mức độ sử dụng và hiệu quả máy chủ Chi phí vốn tải công việc AI: không được bao gồm trong phân tích này Chi phí vốn tải công việc không phải AI: không được bao gồm trong phân tích này Đầu tư chính: phần mềm trung tâm dữ liệu, tự động hóa được AI hỗ trợ, silicon tùy chỉnh

Cơ hội. Nhà vận hành mở rộng quy mô hiệu quả trong khi cân bằng ROI, hiệu suất và sử dụng năng lượng có thể thúc đẩy vị trí dẫn đầu ngành dài hạn.

Thách thức. Các ứng dụng được AI lưu trữ chưa trưởng thành có thể làm mờ tính toán ROI dài hạn. Sự không hiệu quả trong hoạt động trung tâm dữ liệu đang thúc đẩy chi phí tăng lên, nhưng sự không chắc chắn trong nhu cầu AI tiếp tục phá vỡ quy hoạch cơ sở hạ tầng dài hạn và quyết định mua sắm.

Giải pháp. Trong khi trung tâm dữ liệu ngày nay hoạt động ở mức hiệu quả cao, tốc độ đổi mới AI nhanh chóng sẽ đòi hỏi nhà điều hành tối ưu hóa cả tiêu thụ năng lượng và quản lý tải công việc. Một số nhà điều hành đang cải thiện hiệu quả năng lượng trong trung tâm dữ liệu của họ bằng cách đầu tư vào giải pháp làm mát hiệu quả hơn và tăng khả năng xếp chồng giá đỡ để giảm yêu cầu không gian mà không hy sinh sức mạnh xử lý, ví dụ. Những người khác đang đầu tư vào phát triển mô hình AI để tạo ra kiến trúc cần ít sức mạnh tính toán hơn để được đào tạo và vận hành.

5. Kiến trúc sư AI

Họ là ai: nhà phát triển mô hình AI, nhà cung cấp mô hình nền tảng và doanh nghiệp xây dựng khả năng AI độc quyền Chi phí vốn tải công việc AI: không được bao gồm trong phân tích này Chi phí vốn tải công việc không phải AI: không được bao gồm trong phân tích này Đầu tư chính: cơ sở hạ tầng đào tạo và suy luận mô hình, nghiên cứu thuật toán

Cơ hội. Kiến trúc sư AI phát triển kiến trúc cân bằng hiệu suất với yêu cầu tính toán thấp hơn sẽ dẫn đầu làn sóng áp dụng AI tiếp theo. Doanh nghiệp đầu tư vào khả năng AI độc quyền có thể giành được tính cạnh tranh bằng cách phát triển các mô hình chuyên biệt phù hợp với nhu cầu của họ.

Thách thức. Các vấn đề quản trị AI, bao gồm sự thiên vị, an ninh và quy định, tăng thêm sự phức tạp và có thể làm chậm phát triển. Trong khi đó, suy luận đặt ra một thành phần chi phí không thể dự đoán lớn, và doanh nghiệp đang gặp khó khăn trong việc chứng minh ROI rõ ràng từ đầu tư AI.

Giải pháp. Nhu cầu tính toán ngày càng tăng của các mô hình AI quy mô lớn đang thúc đẩy chi phí đào tạo chúng tăng lên, đặc biệt là về suy luận, hoặc quá trình mà các mô hình AI đã được đào tạo áp dụng kiến thức đã học vào dữ liệu mới, chưa được thấy để đưa ra dự đoán hoặc quyết định. Các mô hình có khả năng suy luận nâng cao, như OpenAI's o1, đòi hỏi chi phí suy luận cao hơn đáng kể. Ví dụ, chi phí suy luận trên OpenAI's o1 cao gấp sáu lần so với GPT-4o không suy luận của công ty. Để giảm chi phí suy luận, các công ty AI hàng đầu đang tối ưu hóa kiến trúc mô hình của họ bằng cách sử dụng kỹ thuật như kích hoạt thưa thớt và chưng cất. Những giải pháp này giảm sức mạnh tính toán cần thiết khi mô hình AI tạo ra phản hồi, làm cho hoạt động hiệu quả hơn.

Những cân nhắc quan trọng cho tăng trưởng cơ sở hạ tầng AI

Khi các công ty lập kế hoạch đầu tư cơ sở hạ tầng AI, họ sẽ phải điều hướng một loạt các kết quả tiềm năng. Trong kịch bản nhu cầu hạn chế, năng lực trung tâm dữ liệu liên quan đến AI có thể đòi hỏi 3.700 tỷ đô la chi phí vốn—bị giới hạn bởi các hạn chế chuỗi cung ứng, gián đoạn công nghệ và sự không chắc chắn địa chính trị. Tuy nhiên, những rào cản này được giảm thiểu trong kịch bản nhu cầu tăng tốc, dẫn đến đầu tư cao tới 7.900 tỷ đô la. Theo dõi bối cảnh đang phát triển là rất quan trọng để đưa ra quyết định đầu tư chiến lược có thông tin. Một số điều không chắc chắn mà nhà đầu tư phải xem xét bao gồm:

Gián đoạn công nghệ. Đột phá trong kiến trúc mô hình, bao gồm lợi ích hiệu quả trong sử dụng tính toán, có thể giảm nhu cầu phần cứng và năng lượng dự kiến.

Hạn chế chuỗi cung ứng. Thiếu hụt lao động, tắc nghẽn chuỗi cung ứng và rào cản quy định có thể trì hoãn kết nối lưới điện, sự sẵn có của chip và mở rộng trung tâm dữ liệu—làm chậm tổng thể áp dụng và đổi mới AI. Để giải quyết tắc nghẽn chuỗi cung ứng cho các chip quan trọng, các công ty bán dẫn đang đầu tư vốn đáng kể để xây dựng các cơ sở sản xuất mới, nhưng việc xây dựng này có thể bị đình trệ do hạn chế quy định và thời gian dẫn dắt dài từ nhà cung cấp thiết bị đầu vào.

Căng thẳng địa chính trị. Thuế quan và kiểm soát xuất khẩu công nghệ dao động có thể đưa ra sự không chắc chắn trong nhu cầu sức mạnh tính toán, có thể ảnh hưởng đến đầu tư cơ sở hạ tầng và tăng trưởng AI.

Cuộc đua cho lợi thế cạnh tranh

Những người chiến thắng của kỷ nguyên điện toán do AI thúc đẩy sẽ là các công ty dự đoán nhu cầu sức mạnh tính toán và đầu tư phù hợp. Các công ty trong chuỗi giá trị sức mạnh tính toán chủ động bảo đảm tài nguyên quan trọng—đất đai, vật liệu, công suất năng lượng và sức mạnh tính toán—có thể giành được lợi thế cạnh tranh đáng kể. Để đầu tư với sự tự tin, họ có thể thực hiện cách tiếp cận ba mũi nhọn.

Đầu tiên, nhà đầu tư sẽ cần hiểu dự báo nhu cầu trong bối cảnh không chắc chắn. Các công ty nên đánh giá nhu cầu điện toán AI sớm, dự đoán sự thay đổi tiềm năng trong nhu cầu và thiết kế chiến lược đầu tư có thể mở rộng có thể thích ứng khi các mô hình và trường hợp sử dụng AI phát triển. Thứ hai, nhà đầu tư nên tìm cách đổi mới về hiệu quả tính toán. Để làm điều này, họ có thể ưu tiên đầu tư vào công nghệ điện toán hiệu quả về chi phí và năng lượng, tối ưu hóa hiệu suất trong khi quản lý tiêu thụ điện năng và chi phí cơ sở hạ tầng. Thứ ba, họ có thể xây dựng khả năng phục hồi phía cung để duy trì tăng trưởng cơ sở hạ tầng AI mà không mở rộng quá mức vốn. Điều này sẽ đòi hỏi nhà đầu tư bảo đảm đầu vào quan trọng như năng lượng và chip, tối ưu hóa lựa chọn địa điểm và xây dựng tính linh hoạt vào chuỗi cung ứng của họ.

Đạt được sự cân bằng đúng giữa tăng trưởng và hiệu quả vốn sẽ là rất quan trọng. Đầu tư chiến lược không chỉ là cuộc đua để mở rộng quy mô cơ sở hạ tầng dữ liệu—đó là cuộc đua để định hình tương lai của chính AI.

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute AI viễn thông 2025-04-28 17:48:31

Huawei và China Telecom vừa ra mắt siêu nút tính toán thông minh Ascend đầu tiên trên thế giới

Huawei cùng China Telecom vừa công bố siêu nút tính toán thông minh Ascend thương mại đầu tiên trên thế giới tại Quảng Đông, Hồng Kông, Ma Cao và Thiều Quan, thuộc khu vực Greater Bay Area.
Sự kiện ra mắt có hơn 200 người tham dự, đánh dấu bước tiến lớn của Huawei trong lĩnh vực AI computing.
Siêu nút (super node) là thành phần quan trọng trong mạng hoặc cấu trúc đồ thị, giúp kết nối nhiều nút khác nhau và thực hiện các chức năng đặc biệt như định tuyến, proxy.
Sản phẩm nổi bật là CloudMatrix 384, được quảng bá có khả năng vượt trội so với Nvidia NVL72 về sức mạnh tính toán AI.
CloudMatrix 384 có băng thông truyền tải gấp đôi Nvidia NVL72, cho phép nhiều GPU tương tác và truyền dữ liệu hiệu quả hơn.
Dù CloudMatrix 384 tiêu thụ điện năng cao hơn đối thủ (2,3 lần so với Nvidia NVL72), nhưng vẫn đảm bảo hiệu suất vượt trội.
Hiện tại, chi tiết về mục đích sử dụng cụ thể của siêu nút Ascend chưa được công bố, thông tin sẽ được cập nhật trong thời gian tới.
Sự kiện này củng cố vị thế của Huawei trong cuộc đua AI, đặc biệt khi các công ty Trung Quốc đang đẩy mạnh phát triển công nghệ nguồn mở và AI tạo sinh.

📌 Huawei và China Telecom vừa trình làng siêu nút tính toán thông minh Ascend đầu tiên trên thế giới, với CloudMatrix 384 có băng thông gấp đôi Nvidia NVL72 nhưng tiêu thụ điện năng cao hơn 2,3 lần. Sự kiện thu hút hơn 200 người, khẳng định bước tiến lớn của AI Trung Quốc.

https://www.huaweicentral.com/huawei-china-telecom-unveils-worlds-first-smart-computing-ascend-super-node/

Không có file đính kèm.

Nguồn tham khảo

AI market AI chips-hardware-compute 2025-04-27 05:45:21

Phát triển AI của Trung Quốc sẽ 'hầu như không bị ảnh hưởng' bởi quy định xuất khẩu chip của Mỹ

Các nhà phân tích nhận định lệnh cấm xuất khẩu chip Nvidia sang Trung Quốc sẽ không làm chậm đáng kể tiến trình phát triển AI tại nước này.
Doanh nghiệp Trung Quốc đã giảm phụ thuộc vào chip Nvidia, chuyển sang sử dụng các giải pháp thay thế như chip do Huawei sản xuất và các chip nội địa khác.
Nhiều doanh nghiệp đã huấn luyện mô hình AI trên thiết bị biên như máy tính cá nhân, laptop không bị hạn chế xuất khẩu chip, đồng thời chuyển phần lớn tác vụ suy luận sang các giải pháp thay thế Nvidia.
Việc cấm xuất khẩu chip H20 của Nvidia bị cho là "không hợp lý", vì hiệu năng chip này đã thấp hơn các lựa chọn nội địa và động thái này sẽ giúp Huawei chiếm lĩnh hoàn toàn thị trường AI Trung Quốc.
Các doanh nghiệp AI Trung Quốc đã phát triển giải pháp kết nối chip Huawei, chip nội địa với chip Nvidia, dù vẫn gặp khó khăn về phần mềm khi chuyển đổi giữa các nền tảng chip.
Các công ty có doanh thu từ dịch vụ mô hình nền tảng (tương tự OpenAI, Anthropic) sẽ gặp khó khăn nhất khi chuyển đổi, do phụ thuộc vào phần mềm CUDA độc quyền của Nvidia.
Một doanh nghiệp Trung Quốc phải mất 200 kỹ sư và 6 tháng để chuyển mô hình từ Nvidia sang Huawei, nhưng hiệu năng chỉ đạt 90% so với trước.
Huawei được đánh giá là đối thủ mạnh nhất của Nvidia tại Trung Quốc, với tiềm năng tiếp tục thu hẹp khoảng cách hiệu năng và đổi mới như Deepseek để bù đắp thiếu hụt tính toán.
Nguồn cung chip dự kiến vẫn bị hạn chế trong tương lai gần, do Huawei và các hãng lớn vẫn phụ thuộc vào sản xuất của TSMC tại Đài Loan.

📌 Trung Quốc vẫn tăng trưởng AI mạnh mẽ bất chấp lệnh cấm chip Nvidia, nhờ chuyển đổi sang chip Huawei và nội địa, tối ưu hóa mô hình trên thiết bị biên, dù quá trình chuyển đổi phần mềm còn nhiều thách thức và nguồn cung chip vẫn hạn chế.

https://www.businessinsider.com/nvidia-chip-export-bans-unlikely-hinder-china-ai-growth-2025-4

Phát triển AI của Trung Quốc sẽ 'hầu như không bị ảnh hưởng' bởi quy định xuất khẩu chip, theo các nhà phân tích

Tác giả: Emma Cosgrove

Tingshu Wang/Reuters

23 tháng 4 năm 2025, 22:05 UTC

Lệnh cấm chip Nvidia sẽ không ngăn được tiến trình AI của Trung Quốc, theo các nhà phân tích.
Các công ty Trung Quốc đang giảm phụ thuộc vào Nvidia, tìm các giải pháp thay thế như Huawei.
Cấm xuất khẩu chip H20 sẽ 'không có ý nghĩa', theo Bernstein.

Cấm xuất khẩu chip Nvidia không có khả năng cản trở sự phát triển AI tiên tiến của Trung Quốc, theo các nhà phân tích của Bernstein.

Nvidia thông báo với các nhà đầu tư trong hồ sơ quy định mới tuần trước rằng công ty này dự kiến chính quyền Trump sẽ yêu cầu giấy phép để xuất khẩu các loại chất bán dẫn mạnh được sử dụng để xây dựng sản phẩm AI sang Trung Quốc. Các nhà phân tích hiểu rộng rãi yêu cầu giấy phép này như một lệnh cấm xuất khẩu.

Công ty chip Mỹ cho biết sẽ phải chịu 5,5 tỷ USD chi phí liên quan đến hàng tồn kho, cam kết mua hàng và dự phòng cho mẫu chip H20 trong quý đầu tiên, kết thúc vào ngày 27 tháng 4.

Nvidia đã thiết kế chip H20 để phù hợp chính xác với giới hạn của chính quyền Biden về công suất chip được phép bán cho các công ty Trung Quốc, với mục đích hạn chế tiến độ AI của Trung Quốc. (Một cuộc điều tra mới của quốc hội đặt vấn đề về phản ứng này đối với các quy định.)

"Cấm H20 sẽ không có ý nghĩa vì hiệu suất của chip này đã thấp hơn nhiều so với các giải pháp thay thế của Trung Quốc; lệnh cấm sẽ chỉ đơn giản là trao toàn bộ thị trường AI Trung Quốc cho Huawei," các nhà phân tích Bernstein viết trong báo cáo gửi nhà đầu tư hôm thứ Tư.

AI Trung Quốc tiến bộ bất chấp hạn chế chip như thế nào

Các công ty Trung Quốc đang giảm phụ thuộc vào chip Nvidia, theo các nhà phân tích. Để làm điều này, các công ty đã tìm cách thực hiện đào tạo mô hình trên các thiết bị biên không bị hạn chế, như máy tính cá nhân và laptop. Các công ty cũng đã chuyển phần lớn khối lượng công việc suy luận, các phản hồi và hành động do AI tạo ra, sang các giải pháp thay thế Nvidia.

Các công ty Trung Quốc cũng đã tìm ra cách để chip do gã khổng lồ công nghệ nội địa Huawei hoặc các chip sản xuất trong nước khác và chip Nvidia hoạt động cùng nhau trong mạng, mặc dù phần mềm vẫn là thách thức trong việc chuyển đổi hoàn toàn từ chip này sang chip khác.

"Kiểm tra kênh phân phối của chúng tôi cho thấy hầu hết các công ty có thể tiếp tục hoạt động mà không cần chip H20," các nhà phân tích viết.

Các công ty Trung Quốc có doanh thu từ đăng ký mô hình nền tảng — tương tự như các công ty Mỹ OpenAI hoặc Anthropic — sẽ gặp khó khăn nhất trong việc chuyển đổi từ chip Nvidia sang giải pháp thay thế, vì đào tạo mô hình phụ thuộc nhiều hơn vào phần mềm độc quyền CUDA của Nvidia.

Một công ty Trung Quốc cần 200 kỹ sư và 6 tháng để chuyển một mô hình từ nền tảng Nvidia sang chip Huawei, và vẫn chỉ đạt được 90% hiệu suất trước đó, theo Bernstein.

Huawei là thách thức lớn nhất đối với Nvidia tại Trung Quốc.

"Về lâu dài, kỳ vọng Huawei sẽ tiếp tục thu hẹp khoảng cách về hiệu suất và các mô hình nền tảng Trung Quốc bù đắp sự thiếu hụt năng lực tính toán bằng sự đổi mới kiểu Deepseek," các nhà phân tích viết.

Tuy nhiên, nguồn cung chip có thể sẽ bị hạn chế trong tương lai gần, các nhà phân tích bổ sung, vì Huawei, giống như hầu hết các công ty lớn trong lĩnh vực chip AI, phần nào phụ thuộc vào sản xuất từ Taiwan Semiconductor Manufacturing Company.

China's AI growth will be 'largely unaffected' by chip export rules, analysts say

By Emma Cosgrove Apr 23, 2025, 10:05 PM UTC

Banning Nvidia chips won't halt China's AI progress, analysts say.
Chinese firms are reducing reliance on Nvidia, finding alternatives like Huawei.
Banning H20 chip exports would 'make no sense,' according to Bernstein.

Banning the export of Nvidia chips is unlikely to stymie China's development of advanced AI, according to Bernstein analysts.

Nvidia notified investors in a new regulatory filing last week that it expects the Trump administration to require a license for exporting the type of powerful semiconductors used to build AI products to China. Analysts widely interpreted the license requirement as an export ban.

The US chip firm said it would incur $5.5 billion in charges related to inventory, purchase commitments, and reserves for its H20 chip model in the first quarter, which ends on April 27.

Nvidia designed its H20 chip to exactly fit with Biden administration limits on the power of chips that could be sold to Chinese companies, the aim of which was to curb China's AI progress. (A new congressional inquiry takes issue with this reaction to the regulations.)

"Banning the H20 would make no sense as its performance is already well below Chinese alternatives; a ban would simply hand the Chinese AI market completely over to Huawei," Bernstein analysts wrote in a note to investors Wednesday.

How Chinese AI progressed despite chip limits

Chinese companies have been reducing their reliance on Nvidia chips, according to the analysts. To do so they have found ways to perform model training on unrestricted edge devices, like personal computers and laptops. They've also moved much of the inference workloads, the AI-generated responses and actions, to Nvidia alternatives.

Chinese companies have also engineered ways for chips designed by their homegrown tech giant, Huawei, or other locally made chips, and Nvidia chips to be networked together, though software remains a challenge in fully converting from chip to chip.

"Our channel checks have shown that most companies are able to carry on without H20 chips," the analysts wrote.

Chinese companies with revenue from foundation model subscriptions — similar to US firms OpenAI or Anthropic — will have the hardest time converting from Nvidia chips to alternatives, since training models is more dependent on Nvidia's proprietary software CUDA.

One Chinese company required 200 engineers and six months to move a model from the Nvidia platform to Huawei chips, and it still only reached 90% of the previous performance, according to Bernstein.

Huawei presents the most formidable challenge to Nvidia in China.

"In the longer run, expect Huawei to keep closing the gap in performance and Chinese foundational models making up for compute deficiency with Deepseek-like innovation," the analysts wrote.

Chip supply, though, is likely to be constrained for the foreseeable future, they added, as Huawei, like most major players in the AI chips game, is somewhat dependent on production from Taiwan Semiconductor Manufacturing Company.

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-04-25 03:34:12

Chi phí xây dựng trung tâm dữ liệu AI hàng đầu có thể đạt 200 tỷ USD trong 6 năm tới

Nghiên cứu từ Georgetown, Epoch AI và Rand cho thấy trung tâm dữ liệu AI hàng đầu có thể tiêu tốn tới 200 tỷ USD và yêu cầu 9 GW điện (tương đương 9 lò phản ứng hạt nhân) vào tháng 6/2030.
Từ năm 2019 đến 2025, chi phí phần cứng trung tâm dữ liệu AI tăng trung bình 1,9 lần mỗi năm; nhu cầu điện tăng gấp đôi hàng năm.
Trung tâm dữ liệu như Colossus của xAI đã có chi phí khoảng 7 tỷ USD, sử dụng 300 MW điện – tương đương 250.000 hộ gia đình.
Hiệu suất tính toán trên mỗi watt tăng 1,34 lần mỗi năm trong 5 năm qua, nhưng vẫn không đủ bù đắp cho nhu cầu điện tăng mạnh.
OpenAI hợp tác Softbank và nhiều đối tác khác để huy động tới 500 tỷ USD xây dựng mạng lưới trung tâm dữ liệu AI tại Mỹ và có thể ở nơi khác.
Microsoft, Google, AWS cam kết chi hàng trăm triệu USD mở rộng trung tâm dữ liệu trong năm nay.
Dự báo đến 2030, tiêu thụ điện của trung tâm dữ liệu sẽ tăng 20%, có thể đẩy nguồn năng lượng tái tạo đến giới hạn và buộc phải dùng thêm điện từ nhiên liệu hóa thạch.
Trung tâm dữ liệu AI còn gây áp lực lên nguồn nước, chiếm dụng đất đai và làm giảm nguồn thu thuế của nhiều bang tại Mỹ (ít nhất 10 bang mất hơn 100 triệu USD/năm do ưu đãi thuế).
Một số tập đoàn lớn như AWS, Microsoft đã bắt đầu giảm tốc các dự án trung tâm dữ liệu do lo ngại mở rộng quá mức, thị trường có dấu hiệu “hạ nhiệt” đầu 2025.

📌 Trong 6 năm tới, chi phí xây dựng trung tâm dữ liệu AI hàng đầu có thể đạt 200 tỷ USD, cần 9 GW điện (bằng 9 lò phản ứng hạt nhân), gây áp lực lớn lên lưới điện, môi trường và ngân sách địa phương, dù hiệu suất năng lượng đã cải thiện nhưng vẫn không đủ bù đắp nhu cầu tăng vọt.

https://techcrunch.com/2025/04/24/within-six-years-building-the-leading-ai-data-center-may-cost-200b/

https://arxiv.org/pdf/2504.16026

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute AI viễn thông 2025-04-24 14:28:32

Cách hạ tầng AI đang tạo nên cuộc cách mạng kinh tế tiếp theo

AI ngày nay đang trong giai đoạn giữa: đã chứng minh sức mạnh nhưng chưa được ứng dụng rộng khắp. Tác giả gọi đây là “thời kỳ giữa” (the between times).
AI từng chỉ là giải pháp thay thế những công cụ phân tích truyền thống — gọi là “point solution”. Nhưng để tạo ra giá trị kinh tế thực sự, AI cần trở thành một “hệ thống” toàn diện.
So sánh với điện: ban đầu chỉ thay thế hơi nước (giải pháp điểm), nhưng chỉ khi điện tái cấu trúc cả quy trình sản xuất (như dây chuyền linh hoạt) thì mới tạo ra tăng trưởng năng suất vượt bậc.
Tương tự, AI cần được tích hợp sâu vào cách các tổ chức vận hành, không chỉ đơn giản thay thế con người trong một công đoạn.
Lợi ích chính của AI là tách rời dự đoán khỏi cách thiết kế tổ chức — cho phép tái định hình cách ra quyết định.
Các tập đoàn lớn đang chi hàng nghìn tỷ USD vì họ tin rằng AI sẽ trở thành nền tảng của một cuộc cách mạng kinh tế toàn cầu – giống như điện từng làm với công nghiệp.
Dẫn chứng từ cuốn sách Power and Prediction (2022): AI sẽ chỉ thể hiện toàn bộ tiềm năng khi con người hiểu rõ và khai thác lợi ích của khả năng dự đoán của nó.
AI không chỉ là thách thức kỹ thuật (thu thập dữ liệu, huấn luyện mô hình) mà là thách thức tổ chức – làm sao để con người đưa ra quyết định đúng lúc với sự hỗ trợ của AI.
Các nhà sáng tạo cần chuyển từ tư duy công nghệ sang tư duy hệ thống – tạo ra “giải pháp toàn hệ thống” (system solutions) thay vì công cụ đơn lẻ.

📌AI chỉ trở thành lực lượng kinh tế khi nó được tích hợp như một hệ thống toàn diện, chứ không đơn thuần là công cụ thay thế. Giống như điện, AI cần tái cấu trúc cách tổ chức vận hành. Đó là lý do tại sao đầu tư vào hạ tầng AI là bắt buộc để tạo ra tăng trưởng kinh tế bền vững và đột phá.

https://content.rcrwireless.com/ai-infrastructure-report-2025

6 trụ cột của hạ tầng AI, vai trò của từng thành phần và lý do tại sao sự tích hợp là yếu tố then chốt.

Hạ tầng AI là một hệ sinh thái phụ thuộc lẫn nhau, bao gồm 6 trụ cột: nền tảng dữ liệu, mô hình AI, phần cứng trung tâm dữ liệu, mạng truyền dữ liệu, bán dẫn và bộ nhớ/lưu trữ.
AI phát triển nhanh nhờ 3 yếu tố: phần cứng tiên tiến, tập dữ liệu khổng lồ và cải tiến thuật toán liên tục.
Quy trình AI bắt đầu từ dữ liệu: chuẩn bị và quản lý dữ liệu tốt là yếu tố quyết định hiệu quả mô hình AI.
Mô hình AI hiện nay bao gồm cả ML truyền thống và các mô hình AI tạo sinh đa phương thức (multimodal), LLMs – mã nguồn mở và đóng.
Phần cứng trung tâm dữ liệu (HPC) như GPU, TPU, hệ thống làm mát và thiết kế tiết kiệm năng lượng là nền tảng để xử lý tải AI nặng.
Mạng truyền dẫn như cáp quang, Ethernet, mạng không dây và giao tiếp độ trễ thấp giúp vận chuyển khối dữ liệu lớn giữa các môi trường điện toán (cloud, edge).
Bán dẫn AI chuyên dụng gồm: CPU, GPU, NPU, TPU và các bộ tăng tốc AI tùy biến giúp tăng tốc huấn luyện và suy luận AI.
Bộ nhớ và lưu trữ như HBM, DDR5, NVMe giúp truy xuất và xử lý dữ liệu nhanh chóng trong các giai đoạn: huấn luyện, tinh chỉnh, suy luận.
Mỗi thành phần đều có vai trò riêng nhưng phải được tích hợp chặt chẽ để tránh tắc nghẽn hiệu suất và giới hạn khả năng mở rộng.
Một hạ tầng AI tích hợp chặt chẽ sẽ cho phép ứng dụng từ tự động hóa doanh nghiệp, trợ lý số đến quyết định tự động và AI tạo sinh thời gian thực.
Sự kết hợp nhịp nhàng giữa dữ liệu chất lượng cao, mô hình mạnh, phần cứng tối ưu và mạng linh hoạt là chìa khóa giúp AI phát huy hiệu quả trong thực tế.

Bùng nổ hạ tầng AI đang mở đường cho một cuộc cách mạng kinh tế mới.

Các khoản đầu tư vào hạ tầng AI đang tăng chóng mặt do 2 mục tiêu: thu lợi nhuận ngắn hạn từ ứng dụng AI và tiến tới AGI – trí tuệ nhân tạo tổng quát.
OpenAI nêu 3 quan sát về kinh tế AI:
- Trí tuệ AI tỷ lệ với logarit tài nguyên sử dụng.
- Chi phí sử dụng AI giảm 10 lần mỗi năm → thúc đẩy sử dụng.
- Giá trị kinh tế từ AI tăng siêu hàm mũ theo mức tăng trí tuệ.
Định luật mở rộng AI (AI Scaling Laws): hiệu năng AI tăng khi tăng mô hình, dữ liệu và sức mạnh tính toán. Tuy nhiên, 3 yếu tố này cần mở rộng đồng thời, nếu không sẽ giảm hiệu quả.
Chinchilla Scaling Hypothesis (DeepMind): tối ưu hiệu năng bằng cách cân bằng kích thước tập dữ liệu và tài nguyên tính toán thay vì chỉ tăng kích thước mô hình.
CEO Microsoft, Satya Nadella nhấn mạnh: hạ tầng của hyperscaler (siêu trung tâm dữ liệu) giúp hiện thực hóa định luật mở rộng. Vấn đề hiện tại không còn là GPU, mà là điện năng để vận hành AI.
NVIDIA bổ sung 2 định luật mới:
- Post-training scaling: tinh chỉnh sau huấn luyện giúp tối ưu mô hình với ít tài nguyên hơn (fine-tuning, pruning, distillation…).
- Test-time scaling: tối ưu mô hình trong lúc suy luận bằng cách điều chỉnh tài nguyên theo đầu vào (dynamic inference, quantization…).
Các định luật mới làm tăng nhu cầu tính toán tại cả huấn luyện và suy luận → thúc đẩy đầu tư hạ tầng mạnh hơn.
Tăng trưởng năng suất từ AI được ví như các cuộc cách mạng nông nghiệp và công nghiệp. Một “chế độ tăng trưởng mới” có thể khiến kinh tế toàn cầu tăng gấp đôi mỗi vài tuần.
Alphabet, Amazon, Meta và Microsoft sẽ đầu tư tổng cộng 315 tỷ USD vào hạ tầng AI chỉ trong năm 2025.
Dự án Stargate (do OpenAI dẫn dắt) sẽ đầu tư 500 tỷ USD trong 5 năm để dẫn đầu hạ tầng AGI toàn cầu, với 100.000 GPU và hơn 10 trung tâm dữ liệu.
Google, Amazon, Meta và Microsoft đều coi AI là đòn bẩy tăng trưởng doanh thu dài hạn và sẵn sàng dốc vốn khổng lồ vào hạ tầng – từ silicon đến trung tâm dữ liệu.

Trung tâm dữ liệu đang trở thành trung tâm của cách mạng AI

AI đang biến đổi toàn bộ chiến lược phát triển và vận hành trung tâm dữ liệu. Từ hạ tầng phụ trợ, trung tâm dữ liệu giờ là nền tảng của đổi mới số.
80% nhà vận hành trung tâm dữ liệu đang tăng công suất để đáp ứng nhu cầu AI – theo khảo sát của AFCOM.
Mật độ rack tăng gấp đôi so với năm 2021 và tiếp tục tăng vì các tác vụ AI yêu cầu GPU hiệu năng cao với mức tiêu thụ điện lớn.
Các giải pháp được triển khai bao gồm:
- Tối ưu luồng khí.
- Làm mát bằng chất lỏng (liquid cooling).
- Cảm biến giám sát thông minh.
Làm mát bằng chất lỏng đang trở thành xu hướng chính do hiệu suất cao, bao gồm: làm mát trực tiếp tới chip (direct-to-chip cold plate) và làm mát bằng ngâm chất lỏng (immersion cooling).
Địa lý ảnh hưởng đến thiết kế trung tâm dữ liệu, ví dụ chọn vị trí có khí hậu mát để sử dụng “free cooling” từ không khí hoặc nước bay hơi.
Thiết kế trung tâm dữ liệu hiện đại cần:
- Tăng khả năng chịu tải sàn.
- Tích hợp hệ thống điện DC điện áp cao.
- Hỗ trợ thiết bị làm mát và lưu trữ năng lượng tiên tiến.
Tiêu thụ điện của trung tâm dữ liệu có thể tăng gấp đôi đến năm 2026 (theo IEA), từ 240–340 TWh (2022) lên gần 857 TWh vào 2028.
Để giảm tác động môi trường và chi phí vận hành, trung tâm dữ liệu chuyển sang năng lượng tái tạo (55% chọn điện mặt trời, nhiều nơi cân nhắc năng lượng hạt nhân).
AI còn giúp chính mình – sử dụng AI để quản lý điện năng, tối ưu PUE và phân phối tải năng lượng.
Dự án Stargate của OpenAI, SoftBank và Oracle đang xây dựng hơn 10 trung tâm dữ liệu tại Texas, với cụm GPU 100.000 chiếc – tạo ra một hyperscaler mới cạnh tranh với AWS, Azure, Google Cloud.
Dự án Stargate có mục tiêu không chỉ kinh tế mà còn mang tính địa chính trị – khẳng định vị thế Mỹ trong cuộc đua AI toàn cầu.
AFCOM: "Mọi trung tâm dữ liệu đang trở thành trung tâm dữ liệu AI" – khẳng định vai trò trung tâm dữ liệu trong hạ tầng AI thế hệ tiếp theo.

Sự hội tụ giữa scaling khi suy luận và AI tại biên – mở ra kỷ nguyên AI phân tán thông minh

AI đang chuyển từ huấn luyện tập trung trên đám mây sang suy luận phân tán tại thiết bị, tạo ra nhu cầu tối ưu tài nguyên tại thời điểm suy luận (test-time inference scaling).
Test-time scaling cho phép mô hình điều chỉnh lượng tài nguyên tính toán dựa trên độ phức tạp của tác vụ, yêu cầu độ trễ và phần cứng sẵn có.
Edge AI (AI tại biên) xử lý dữ liệu trực tiếp trên thiết bị hoặc gần nguồn dữ liệu → giảm độ trễ, tăng bảo mật, tiết kiệm băng thông và chi phí.
Qualcomm, Intel, Dell và Verizon đều đang đẩy mạnh chiến lược AI tại biên:
- Qualcomm gọi đây là “kỷ nguyên suy luận AI”.
- Intel phát triển giải pháp "rack-scale" cho AI và tập trung AI inference tại biên như một lợi thế dài hạn.
- Dell nhấn mạnh hybrid AI (biên - cloud) là tương lai.
Agentic AI: hệ thống AI tác tử có thể tự hành động, học hỏi và điều chỉnh theo thời gian thực – đặc biệt phù hợp khi vận hành ở biên.
Ví dụ từ Dell: trong nhà máy, AI kiểm tra chất lượng có thể tự phát hiện lỗi khi điều kiện thay đổi và điều chỉnh mô hình mà không cần gửi lại đám mây.
Điều kiện tiên quyết để agentic AI hoạt động hiệu quả tại biên:
- Chuẩn hóa giao tiếp giữa các tác tử AI.
- Tích hợp hạ tầng AI từ thiết bị → edge → cloud.
Memory wall: giới hạn khi AI chip xử lý nhanh hơn tốc độ truyền từ bộ nhớ – trở thành nút thắt cổ chai khi suy luận tại biên.
- Giải pháp: Processing-in-Memory (PIM) – xử lý trực tiếp trong bộ nhớ để giảm chi phí, điện năng và độ trễ.
Các công nghệ bộ nhớ mới (LPDDR5/5x) vẫn chưa đáp ứng hoàn toàn nhu cầu tốc độ AI, đặc biệt trên điện thoại hay thiết bị cá nhân.
Verizon ra mắt "AI Connect" – tận dụng mạng viễn thông sẵn có để hỗ trợ inference thời gian thực trên quy mô lớn.
AI tại biên cũng là lời giải cho quy định bảo mật dữ liệu và chi phí vận hành – vì dữ liệu không cần gửi về cloud.

Cú sốc DeepSeek: huấn luyện LLM chỉ với 6 triệu USD, đe dọa thế độc tôn của Big Tech?

DeepSeek, startup AI từ Trung Quốc, công bố mô hình ngôn ngữ lớn (LLM) R1 v3 được huấn luyện với chi phí chỉ 6 triệu USD, gây sốc cho thị trường AI toàn cầu.
Mô hình được huấn luyện với 14 nghìn tỷ token và sử dụng 2.048 GPU NVIDIA H800 – tương đương huấn luyện LLaMA 70B của Meta.
CEO Groq cho rằng: số tiền 6 triệu USD không tính hạ tầng phần cứng (GPU, điện, dữ liệu) → giá trị thực có thể lớn hơn nhiều.
DeepSeek được đánh giá cao nhờ hiệu quả thuật toán, không chỉ dựa vào phần cứng lớn – xu hướng mới trong ngành AI.
Phản ứng thị trường: cổ phiếu của NVIDIA, Microsoft, ASML giảm vì lo ngại sự trỗi dậy của mô hình chi phí thấp nhưng hiệu năng cao.
Jevons Paradox áp dụng vào AI: hiệu suất càng cao, nhu cầu tính toán càng tăng. Tối ưu không giảm tổng cầu mà còn làm tăng tốc độ đầu tư hạ tầng.
DeepSeek tập trung vào open model – mô hình mã nguồn mở đang phá thế độc quyền của các mô hình đóng (closed).
Cạnh tranh Mỹ - Trung trong AI không còn là về thuật toán, mà là tranh giành quyền kiểm soát năng lực tính toán (compute).
IDC nhận định: ngành AI đang chuyển dần khỏi các mô hình khổng lồ đa năng sang mô hình nhỏ, tinh chỉnh, chuyên biệt.
Ưu điểm mô hình nhỏ:
- Ít tốn tài nguyên.
- Hiệu quả với các tác vụ cụ thể.
- Dễ triển khai trên thiết bị cá nhân hoặc tại biên.
Sự dịch chuyển này có thể giảm nhu cầu về hạ tầng khổng lồ, mở ra sân chơi mới cho các công ty nhỏ, các quốc gia mới nổi trong lĩnh vực AI.
Nhà đầu tư nhận định: giá cổ phiếu giảm chỉ là cơ hội “mua rẻ” vì về dài hạn, hạ tầng AI vẫn sẽ tiếp tục mở rộng để đáp ứng nhu cầu tăng trưởng liên tục.

AGI – giấc mơ hay hiểm họa? Cuộc chạy đua trí tuệ nhân tạo tổng quát toàn cầu đang tăng tốc!

AGI (Artificial General Intelligence) là mục tiêu cuối cùng của nhiều công ty công nghệ – một hệ thống AI có khả năng tư duy và giải quyết vấn đề linh hoạt như con người.
Động lực phát triển AGI không chỉ đến từ công nghệ mà còn từ kỳ vọng tăng trưởng kinh tế siêu cấp và sức mạnh địa chính trị.
OpenAI tuyên bố sứ mệnh rõ ràng: "phát triển AGI vì lợi ích toàn nhân loại", nhưng song song đó là hàng loạt đầu tư quy mô lớn đầy tham vọng.
Các rủi ro AGI được đưa ra:
- Khó kiểm soát hành vi AI khi đạt mức trí tuệ tự chủ.
- Phân phối lợi ích không đều – có thể làm tăng bất bình đẳng toàn cầu.
- Sự phát triển thiếu kiểm soát có thể gây hệ quả không lường trước.
Cuộc đua AGI đang diễn ra chủ yếu giữa các quốc gia và tập đoàn lớn (Mỹ, Trung Quốc, Big Tech). Đây là cuộc chiến về dữ liệu, tính toán và tài năng.
Chiến lược kiểm soát AI giống như kiểm soát vũ khí hạt nhân – yêu cầu giám sát toàn cầu, chính sách và tiêu chuẩn đạo đức nghiêm ngặt.
Đầu tư hạ tầng AGI như Project Stargate (500 tỷ USD) cho thấy sự nghiêm túc của các bên về khả năng đạt đến AGI trong tương lai gần.
Có sự đối lập rõ ràng: trong khi một bên thúc đẩy phát triển nhanh chóng để chiếm lợi thế, bên khác kêu gọi kiểm soát chặt chẽ để đảm bảo an toàn.
Một AGI không kiểm soát có thể làm lung lay cấu trúc xã hội hiện tại nếu không được định hướng đúng đắn.
Các nhà lãnh đạo ngành (như Sam Altman, Elon Musk, Geoffrey Hinton…) đều lên tiếng cảnh báo về nguy cơ của AGI nếu không có hướng phát triển minh bạch, kiểm soát và phi tập trung hóa sức mạnh.

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-04-23 23:55:25

Hành trình 12.000 năm từ cách mạng nông nghiệp đến sự ra đời của "nhà máy AI"

Khoảng 12.000 năm trước, cách mạng nông nghiệp đã đánh dấu bước ngoặt đầu tiên: tổ tiên bắt đầu canh tác, hình thành các nhà máy thực phẩm ngoài trời, cần tổ chức xã hội và tạo ra chữ viết để quản lý đầu vào, đầu ra.
Sự phát triển kinh tế từ nông nghiệp sang sản xuất thủ công, rồi tiến đến nhà máy công nghiệp, khiến nhu cầu giáo dục, quyền tự do cá nhân tăng lên, góp phần nâng cao mức sống và hình thành tầng lớp trung lưu.
Internet ra đời giúp kết nối dữ liệu toàn cầu, tạo điều kiện cho AI phát triển khi lượng dữ liệu khổng lồ có thể được xử lý bởi các hệ thống GPU song song với băng thông cao.
Nhờ đủ 3 yếu tố: dữ liệu lớn, sức mạnh tính toán, thuật toán, AI hiện đại mới bùng nổ; trước đó trong thập niên 1980, thuật toán mạng nơ-ron đã có nhưng thiếu dữ liệu và tính toán.
"Nhà máy AI" không còn là ẩn dụ mà là mô hình thực tế với siêu máy tính thương mại (như NVIDIA DGX SuperPOD, GB200 NVL72), cho phép huấn luyện mô hình nền tảng lên tới hàng trăm tỉ hoặc thậm chí nghìn tỉ tham số, xử lý hàng chục nghìn tỉ token dữ liệu.
Jensen Huang (CEO NVIDIA) nhấn mạnh AI factory là kỳ tích kỹ thuật: cần tới hàng chục ngàn kỹ sư, gần 5 tỉ linh kiện, hơn 320.000 km cáp quang (tương đương khoảng cách từ Trái Đất đến Mặt Trăng) để xây dựng.
NVIDIA GB200 NVL72: mỗi rack gồm 72 GPU, 36 CPU, tổng 1,44 exaflops FP4, 13,4 TB HBM3e, 576 TB/giây băng thông bộ nhớ; kết nối tất cả GPU qua NVLink/NVSwitch như một GPU khổng lồ cho huấn luyện mô hình nền tảng và suy luận chain-of-thought.
Một cấu hình SuperPOD 8 rack đạt 11,5 exaflops, 240 TB HBM3e, tiêu thụ gần 1 MW điện năng; có thể mở rộng quy mô chỉ bằng cách bổ sung rack mới.
Hệ thống cần giải pháp làm mát bằng chất lỏng, thể hiện mức độ nghiêm túc tối đa về hiệu suất và hiệu quả năng lượng, giống như các "cỗ máy sắt lớn" của thập niên 1960-70.
Hệ điều phối phần mềm gồm NVIDIA Mission Control, AI Enterprise, Dynamo (nguồn mở), cùng dịch vụ hỗ trợ chuyên gia DGX giúp triển khai và tối ưu AI factory nhanh chóng.
Nhà máy AI tạo ra giá trị mới khi việc sinh token đồng nghĩa với sinh doanh thu, biến trung tâm dữ liệu từ "khoản chi" thành "tài sản sinh lời".

📌 Sau 12.000 năm tiến hóa, nhà máy AI trở thành cột mốc không thể tránh khỏi, thay đổi toàn bộ kinh tế, xã hội: NVIDIA GB200 NVL72 với 72 GPU/rack, 1,44 exaflops/rack, 13,4 TB bộ nhớ, có thể mở rộng vô tận và được xem là động cơ cho mọi lĩnh vực kinh doanh hiện đại.

https://www.theregister.com/2025/04/22/nvidia_ai_factory/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute AI market 2025-04-23 23:41:48

Nvidia đầu tư nhà máy tại Mỹ cùng TSMC, Foxconn, Wistron để sản xuất chip và siêu máy tính AI

Nvidia hợp tác 3 công ty Đài Loan là TSMC, Foxconn, Wistron triển khai hơn 1 triệu foot vuông (tương đương 92.903 m²) nhà xưởng mới tại Arizona và Texas để sản xuất chip AI, siêu máy tính đầu tiên tại Mỹ.
TSMC đã khởi động việc sản xuất chip Blackwell của Nvidia tại Phoenix, Arizona. Foxconn và Wistron sẽ lần đầu tiên sản xuất siêu máy tính Nvidia tại Houston và Dallas, dự kiến sản xuất hàng loạt trong vòng 12-15 tháng tới.
Gói đầu tư này trị giá lên tới 500 tỉ USD (khoảng 12.500.000 tỉ VND) về linh kiện AI trong 4 năm, dự kiến tạo hàng trăm nghìn việc làm, góp phần bảo đảm an ninh kinh tế trị giá hàng ngàn tỉ USD trong nhiều thập kỷ.
Các nhà máy sẽ ứng dụng công nghệ AI tạo sinh, robot, bản sao kỹ thuật số (digital twin) của chính Nvidia để vận hành thông minh, có thể triển khai mạng 5G riêng.
Nvidia hợp tác cùng Amkor và SPIL cho khâu đóng gói và kiểm thử sản phẩm. Toàn bộ chuỗi cung ứng sẽ áp dụng các giải pháp tối tân về sản xuất, đóng gói, lắp ráp, kiểm tra.
Nền tảng Omniverse và Isaac GR00T sẽ dùng để tạo bản sao kỹ thuật số nhà máy và mô hình AI phục vụ cho robot sản xuất.
Nvidia nhấn mạnh những “AI factory” quy mô gigawatt này là hạ tầng cốt lõi cho trung tâm dữ liệu AI trong tương lai, thúc đẩy ngành công nghiệp AI của Mỹ.
Quá trình này nhằm đáp trả biến động địa chính trị, đồng thời đưa sản xuất trở lại Mỹ – phù hợp với xu hướng Industry 4.0 “hồi hương” chuỗi cung ứng, tận dụng công nghệ để bù đắp chi phí lao động cao.
Giám đốc điều hành Jensen Huang khẳng định sản xuất AI cốt lõi tại Mỹ sẽ giúp Nvidia đáp ứng tốt nhu cầu tăng trưởng, tăng cường chuỗi cung ứng và khả năng chống chịu rủi ro.

📌 Nvidia bắt tay TSMC, Foxconn, Wistron xây dựng nhà máy AI tại Mỹ, hướng tới quy mô 500 tỉ USD, tạo hàng trăm ngàn việc làm và tăng cường an ninh kinh tế, ứng dụng mạnh mẽ công nghệ AI, robot, twin kỹ thuật số vào sản xuất, làm nền tảng cho ngành công nghiệp AI tương lai của Mỹ.

https://www.rcrwireless.com/20250415/industry-4-0/nvidia-us-ai-infrastructure

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-04-23 05:15:20

Elon Musk đang huy động hàng chục tỷ USD để xây dựng siêu máy tính AI với 1 triệu GPU cho xAI

Elon Musk gần đây đã tổ chức cuộc gọi với các nhà đầu tư lớn của xAI để huy động hàng chục tỷ USD nhằm định giá công ty một cách hợp lý.
Theo nhà báo tài chính David Faber từ CNBC, số tiền này có thể lên tới 25 tỷ USD, đưa giá trị công ty vào khoảng 150 đến 200 tỷ USD, dù đây vẫn là suy đoán.
Mục đích chính của số vốn được cho là đầu tư vào siêu máy tính Colossus 2 với 1 triệu GPU, vượt xa Colossus hiện tại vốn sở hữu 200.000 GPU Nvidia Hopper H100 và H200.
Chi phí cho 1 triệu GPU Nvidia Blackwell B100 hoặc B200 ước tính từ 50 đến 62,5 tỷ USD, tùy thuộc vào thỏa thuận với Nvidia và đối tác.
Cơ sở hạ tầng đi kèm như tòa nhà, máy chủ, thiết bị mạng và hệ thống làm mát cũng cần khoản tiền tương đương, nâng tổng chi phí lên 100 đến 125 tỷ USD.
xAI chi tiêu lớn vào các cụm siêu máy tính để đào tạo các mô hình AI tiên tiến và tạo doanh thu từ đó, cho thấy tham vọng dẫn đầu trong lĩnh vực AI tạo sinh.
Tuy nhiên, không chỉ xAI mà nhiều công ty khác cũng đang tìm kiếm nguồn vốn khổng lồ cho các trung tâm dữ liệu AI thế hệ mới, với dự đoán sẽ có khoảng 1 triệu bộ xử lý AI vào năm 2027 theo CEO của Broadcom.

📌 Elon Musk đang nỗ lực huy động hàng chục tỷ USD cho xAI, với mục tiêu xây dựng siêu máy tính Colossus 2 có 1 triệu GPU, chi phí lên tới 125 tỷ USD. Tham vọng này khẳng định vị thế tiên phong của xAI trong cuộc đua công nghệ AI toàn cầu.

https://www.tomshardware.com/tech-industry/artificial-intelligence/speculation-mounts-that-musk-will-raise-tens-of-billions-for-ai-supercomputer-with-1-million-gpus-report

Không có file đính kèm.

Nguồn tham khảo

AI market AI chips-hardware-compute 2025-04-23 05:12:15

Amazon chi 1 tỷ USD cho AI, tung Project Greenland vượt khủng hoảng thiếu GPU

Năm ngoái, Amazon đối mặt tình trạng thiếu hụt nghiêm trọng AI chip/GPU trong mảng bán lẻ, gây trì hoãn nhiều dự án lớn và ảnh hưởng đến vận hành của nền tảng thương mại điện tử cùng logistics.
Đầu năm 2024, nhu cầu GPU tăng mạnh toàn cầu do AI tạo sinh bùng nổ, khiến nhân viên Amazon phải chờ nhiều tháng mới được cấp GPU, làm chậm các dự án quan trọng.
Tháng 7/2024, Amazon triển khai Project Greenland – hệ thống “hồ” GPU tập trung, giúp kiểm soát, phân bổ và theo dõi GPU hiệu quả. Công ty siết chặt quy trình phê duyệt GPU, dựa trên dữ liệu ROI và timeline cụ thể thay vì ưu tiên đến trước được cấp trước.
Mọi yêu cầu GPU nội bộ đều phải có dữ liệu chứng minh lợi nhuận và mức độ sẵn sàng triển khai (“shovel-ready”), đồng thời phải cạnh tranh về tốc độ ra thị trường.
Dự án Greenland sử dụng nền tảng điều phối GPU tập trung, cho phép chia sẻ máy chủ, truy xuất GPU nhàn rỗi, đồng thời có tính năng “clawback” - thu hồi GPU từ các dự án đạt hiệu quả thấp để phân bổ lại.
Từ đầu 2025, toàn bộ nhân viên phải thông qua Greenland khi xin GPU mới, giúp giảm lãng phí, tối ưu hóa tài nguyên đám mây AWS.
8 nguyên tắc (tenets) phân bổ GPU được Amazon đặt ra gồm: ưu tiên ROI thực tế, học hỏi liên tục, tránh quyết định theo silo, coi trọng thời gian, tăng hiệu suất, dám chấp nhận rủi ro đổi mới, minh bạch nhưng bảo mật, có thể thu hồi GPU nếu dự án kém hiệu quả.
Mảng bán lẻ đầu tư tổng hơn 1 tỷ USD cho các dự án AI sử dụng GPU năm 2025, trong đó dự kiến chi khoảng 5,7 tỷ USD cho hạ tầng AWS (tăng từ 4,5 tỷ USD năm 2024).
Trong năm qua, AI đã giúp Amazon Retail tăng thêm 2,5 tỷ USD lợi nhuận vận hành và tiết kiệm khoảng 670 triệu USD chi phí biến đổi.
Các dự án AI nổi bật: trợ lý mua sắm Rufus, trình tạo ảnh sản phẩm Theia, hệ thống nhận diện gói hàng cho tài xế, tối ưu lộ trình giao hàng, tự động truy xuất thông tin sản phẩm, điều tra gian lận người bán...
Quý cuối 2024, Amazon thiếu trên 1.000 instance P5 (chứa tới 8 Nvidia H100 GPU), tuy nhiên dự báo thặng dư GPU vào cuối 2025 nhờ cải thiện nguồn cung và dùng chip AI Trainium “cây nhà lá vườn” của AWS.
Dù vậy, tốc độ tăng trưởng nhu cầu AI và GPU vẫn là thách thức lớn, Greenland phải liên tục thích nghi với xu thế, tiếp tục tuyển nhân sự để mở rộng nguồn lực.

📌 Amazon đã chuyển bại thành thắng trong khủng hoảng thiếu GPU, đầu tư trên 1 tỷ USD cho AI năm 2025, tiết kiệm gần 670 triệu USD chi phí và tăng 2,5 tỷ USD lợi nhuận vận hành nhờ các quy trình phân bổ GPU sáng tạo và Project Greenland.

https://www.businessinsider.com/amazon-strategy-overcome-gpu-shortages-nvidia-2025-4

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute AI market 2025-04-21 21:13:39

Huawei chuẩn bị xuất xưởng đại trà chip AI 910C mới, mang lại lựa chọn thay thế Nvidia

Huawei sẽ bắt đầu xuất xưởng đại trà chip AI 910C cho khách hàng Trung Quốc từ tháng 5/2025; một số lô hàng đã được chuyển giao trước đó.
Động thái này diễn ra khi các công ty AI Trung Quốc phải gấp rút tìm giải pháp thay thế Nvidia H20 sau khi Mỹ yêu cầu Nvidia cần giấy phép xuất khẩu để bán H20 tại Trung Quốc từ tháng 4/2025.
Chip 910C thuộc loại GPU, không phải đột phá công nghệ mà là tiến hóa kiến trúc, kết hợp hai bộ xử lý 910B trong cùng một gói nhờ kỹ thuật tích hợp tiên tiến.
Hiệu suất của 910C được nhận định tương đương Nvidia H100 nhờ gấp đôi sức mạnh tính toán và bộ nhớ so với 910B, đồng thời cải thiện khả năng hỗ trợ các tác vụ AI đa dạng.
Việc Mỹ siết xuất khẩu các chip AI mạnh như H100, B200 đã mở đường cho Huawei và các startup Trung Quốc (Moore Threads, Iluvatar CoreX) cạnh tranh trực tiếp với Nvidia tại thị trường nội địa.
Chuyên gia nhận định Huawei Ascend 910C sẽ thành phần chủ lực của các công ty phát triển mô hình AI tại Trung Quốc khi các chip như Nvidia H20 không còn sẵn có.
Huawei đã gửi mẫu chip 910C cho nhiều công ty công nghệ Trung Quốc từ cuối năm 2024 và bắt đầu nhận đơn đặt hàng.
Công ty SMIC đảm nhận sản xuất một số thành phần chính của GPU 910C bằng công nghệ tiến trình N+2 7nm, nhưng tỷ lệ thành phẩm còn thấp.
Một phần chip trong dòng 910C sử dụng chip do TSMC (Đài Loan) sản xuất cho Sophgo (Trung Quốc), dù TSMC khẳng định tuân thủ quy định và ngừng cung cấp cho Huawei từ 9/2020.
Bộ Thương mại Mỹ đang điều tra việc TSMC sản xuất chip cho Sophgo sau khi phát hiện một chip của Sophgo xuất hiện trong bộ xử lý 910B.

📌 Huawei đẩy mạnh xuất xưởng chip AI 910C trong bối cảnh Nvidia H20 bị Mỹ kiểm soát xuất khẩu; chip tích hợp hai 910B, hiệu suất ngang H100; dự kiến trở thành lựa chọn số một cho các công ty AI ở Trung Quốc, đồng thời thúc đẩy ngành chip nội địa dù còn tồn tại thách thức về sản xuất và nguồn cung.

https://www.reuters.com/world/china/huawei-readies-new-ai-chip-mass-shipment-china-seeks-nvidia-alternatives-sources-2025-04-21/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-04-21 21:09:14

CEO Nvidia kêu gọi Nhật Bản tăng nguồn điện và hạ tầng trung tâm dữ liệu để phát triển AI

CEO Nvidia Jensen Huang gặp Thủ tướng Nhật Bản Shigeru Ishiba ngày 21.04 tại Tokyo nhằm vận động tăng sản lượng điện và phát triển trung tâm dữ liệu phục vụ cho AI.
Huang nhấn mạnh Nhật Bản có tiềm năng lớn phát triển AI nhờ vị thế dẫn đầu về robot và sản xuất công nghiệp, nhưng cần xây dựng thêm hạ tầng năng lượng để phục vụ AI.
Chủ đề chính của cuộc gặp xoay quanh việc phát triển hạ tầng mới và vai trò cốt lõi của điện cho tăng trưởng công nghiệp và AI.
Chuyến đi của Huang đến Tokyo diễn ra sau chuyến thăm Bắc Kinh và khi Tổng thống Mỹ Donald Trump vừa cấm Nvidia bán chip AI H20 cho Trung Quốc.
Mỹ tiếp tục siết chặt hạn chế xuất khẩu công nghệ sang Trung Quốc, dù Nvidia đã thiết kế dòng chip H20 riêng cho thị trường này nhằm tuân thủ quy định trước đây.
Nvidia mới đây cảnh báo thiệt hại 5,5 tỷ USD do các hạn chế chip mới của Mỹ, ảnh hưởng đến doanh thu từ thị trường Trung Quốc.
Ủy ban lưỡng đảng Hạ viện Mỹ cũng yêu cầu Nvidia cung cấp thông tin về doanh số chip, do lo ngại AI startup DeepSeek của Trung Quốc dùng chip Nvidia phát triển chatbot đột phá.
Tình hình hiện tại tạo áp lực lớn lên Nvidia trong việc mở rộng thị trường ngoài Trung Quốc, thúc đẩy họ tìm kiếm đối tác và thị trường mới như Nhật Bản.

📌 Nvidia đối mặt thiệt hại 5,5 tỷ USD do hạn chế chip AI của Mỹ với Trung Quốc, CEO Huang chủ động tìm kiếm hỗ trợ từ Nhật Bản để phát triển hạ tầng điện và trung tâm dữ liệu cho AI, đặt trọng tâm vào năng lượng cho tăng trưởng công nghiệp, giữa lúc căng thẳng công nghệ Mỹ-Trung chưa hạ nhiệt.

https://www.bloomberg.com/news/articles/2025-04-21/nvidia-ceo-lobbies-japan-for-more-power-data-centers-to-fuel-ai

Nvidia CEO vận động Nhật Bản cung cấp thêm điện, trung tâm dữ liệu để phát triển AI

Giám đốc điều hành Nvidia Corp. Jensen Huang đã gặp Thủ tướng Nhật Bản Shigeru Ishiba vào thứ Hai để thúc đẩy việc sản xuất thêm điện nhằm đáp ứng nhu cầu của trí tuệ nhân tạo.

Hai bên đã thảo luận về cách Nhật Bản có vị trí đặc biệt thuận lợi để phát triển AI, nhờ vai trò dẫn đầu trong lĩnh vực robot và sản xuất công nghiệp, Huang chia sẻ với phóng viên sau cuộc gặp. Nhưng ông cũng nói rằng việc tạo ra và phát triển trí tuệ sẽ cần năng lượng.

"Đất nước cần xây dựng cơ sở hạ tầng mới," ông nói. "Năng lượng là yếu tố thiết yếu cho mọi sự tăng trưởng công nghiệp."

Cuộc gặp diễn ra ngay sau chuyến đi của CEO đến Bắc Kinh và quyết định của Tổng thống Hoa Kỳ Donald Trump cấm công ty bán chip AI H20 cho Trung Quốc. Động thái này đánh dấu sự leo thang trong cuộc chiến công nghệ của Washington với Bắc Kinh và nhắm vào dòng sản phẩm Nvidia đã thiết kế riêng cho khách hàng Trung Quốc để tuân thủ các quy định kiểm soát xuất khẩu trước đó của Hoa Kỳ.

Tuần trước, Nvidia đã cảnh báo về khoản giảm giá trị 5,5 tỷ đô la do các hạn chế chip mới nhất của Hoa Kỳ. Một ủy ban lưỡng đảng của Hạ viện Hoa Kỳ cũng kêu gọi Nvidia cung cấp thông tin về việc bán chip mà công ty khởi nghiệp AI Trung Quốc DeepSeek có thể đã sử dụng để phát triển chatbot đột phá của họ.

Nvidia CEO Lobbies Japan for More Power, Data Centers to Fuel AI

By Mari Kiyohara

April 21, 2025 at 7:51 AM UTC

Nvidia Corp. Chief Executive Officer Jensen Huang met with Japanese Prime Minister Shigeru Ishiba on Monday to push for more electricity generation to meet artificial intelligence’s needs.

The two discussed how Japan is particularly positioned well to develop AI, given its leadership in robotics and industrial manufacturing, Huang told reporters after the meeting. But he also said that generating and creating intelligence will need energy.

“The country needs to build new infrastructure,” he said. “Energy is essential for all industrial growth.”

The meeting comes on the heels of the CEO’s trip to Beijing and US President Donald Trump’s decision to bar the company from selling H20 AI chip to China. The move marked an escalation in Washington’s tech battle with Beijing and targeted a product line Nvidia explicitly designed for Chinese customers to comply with previous US export controls.

Last week, Nvidia warned of a $5.5 billion writedown from the newest US chip restrictions. A bipartisan US House committee also urged Nvidia to hand over information on sales of chips that Chinese AI upstart DeepSeek may have used to develop its breakthrough chatbot.

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-04-21 00:57:07

TSMC lên tiếng bác bỏ thông tin đã giao chip AI tiên tiến cho Huawei sau lệnh cấm từ Mỹ

TSMC đã phản hồi các báo cáo cho rằng hãng đã chuyển chip AI cho Huawei, khẳng định không chuyển bất kỳ sản phẩm nào cho công ty Trung Quốc từ tháng 9.2020.
Mỹ áp đặt lệnh cấm đối với Huawei từ tháng 5.2020 dưới thời tổng thống Trump, kèm thời gian ân hạn 120 ngày, cho phép hoàn thành đơn đặt hàng trước 15.05 đến ngày 14.09.2020.
Các chip Ascend của Huawei, đối thủ của NVIDIA H100, bị nghi ngờ vẫn tiếp tục được sản xuất nhờ vào việc Huawei từng mua trước các die chip trước lệnh cấm.
Nhiều báo cáo liên quan đến DeepSeek – startup AI Trung Quốc – tiết lộ công ty này đã tiếp cận được GPU H20 đặc biệt cho thị trường Trung Quốc của NVIDIA, sau đó cũng bị Mỹ hạn chế.
Báo cáo từ Center for Strategic and International Studies (CSIS) cho biết Huawei có thể sản xuất trên 500.000 chip AI Ascend tiên tiến, nhưng Huawei đã mua trước các die này từ TSMC trước lệnh cấm, không vi phạm luật Mỹ.
TSMC khẳng định đang tuân thủ mọi quy định, không sản xuất hoặc giao chip 7nm, 5nm hoặc 3nm cho Huawei sau mốc thời gian quy định.
Nếu phát hiện đơn hàng nghi vấn, TSMC sẽ tiến hành điều tra kỹ lưỡng và báo cáo cho chính phủ Mỹ, đồng thời đã chủ động phối hợp với Bộ Thương mại Mỹ để đảm bảo tuân thủ.
Công nghệ tiên tiến nhất hiện tại của TSMC là tiến trình 3nm chủ yếu dùng cho chip tiết kiệm điện như smartphone, chưa từng giao cho Huawei kể từ sau tháng 9.2020.

📌 TSMC kiên quyết bác bỏ các cáo buộc chuyển giao chip AI tiên tiến cho Huawei kể từ tháng 9.2020, đảm bảo tuân thủ lệnh cấm của Mỹ. Huawei đã mua trước die chip từ TSMC, cho phép sản xuất đến 500.000 chip Ascend nhưng không vi phạm quy định. TSMC vẫn phối hợp chặt chẽ với Mỹ để kiểm soát đơn hàng nghi vấn.

https://wccftech.com/tsmc-breaks-silence-on-reports-it-shipped-advanced-ai-chips-to-chinas-huawei/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-04-20 05:36:51

Huawei ra mắt chip AI Ascend 920 thế hệ mới nhằm thay thế Nvidia H20 bị Mỹ hạn chế xuất khẩu sang Trung Quốc

Huawei phát triển chip AI Ascend 920 mới nhằm thay thế Nvidia H20, sau khi Mỹ lên kế hoạch hạn chế xuất khẩu dòng chip này sang Trung Quốc.
Nvidia H20 từng rất được các doanh nghiệp lớn như ByteDance và Tencent đặt mua số lượng hàng nghìn chiếc tại Trung Quốc trong năm 2025.
Khi Mỹ áp đặt các quy định mới, không cho Nvidia bán H20 cho khách hàng Trung Quốc, Huawei đã nhanh chóng tung ra giải pháp thay thế với Ascend 920, giúp củng cố vị thế bản thân và ngành AI trong nước.
Ascend 920 hoàn toàn do Huawei tự nghiên cứu, sản xuất trên tiến trình 6nm của SMIC, áp dụng thiết kế dạng chiplet giống với Ascend 910C trước đó.
Hiệu năng của Ascend 920 đạt 900 TFLOPS, băng thông bộ nhớ đạt 4.000 GB/s, nhanh hơn 30-40% so với chip AI thế hệ trước.
Một số nguồn tin cho rằng Ascend 920 có thể vượt qua cả Nvidia H20 về hiệu năng xử lý AI.
Việc thử nghiệm thực tế Ascend 920 vẫn đang diễn ra, nhưng các nhận định cho thấy Huawei không bỏ lỡ cơ hội để thách thức sự thống trị của Nvidia tại thị trường nội địa Trung Quốc.
Giải pháp AI CloudMatrix 384 Supernode mới của Huawei cũng giúp thu hẹp khoảng cách về sức mạnh tính toán với Nvidia, mở rộng năng lực trung tâm dữ liệu AI tại Trung Quốc.
Thị trường bán dẫn và AI tại Trung Quốc có thể chuyển dịch mạnh sang các giải pháp trong nước nếu Huawei chứng tỏ được ưu thế thực tế của Ascend 920.

📌 Huawei ra mắt Ascend 920 chip AI dùng công nghệ 6nm từ SMIC, hiệu năng 900 TFLOPS, nhanh hơn 30-40% đời trước. Sự thay thế Nvidia H20 từ Huawei có thể đảo chiều thị trường AI tại Trung Quốc, giúp ngành công nghệ bán dẫn nội địa trỗi dậy giữa căng thẳng xuất khẩu Mỹ-Trung.

https://www.huaweicentral.com/huawei-reportedly-built-new-gen-ascend-920-chip-to-fill-nvidia-h20-gap-in-china/

Không có file đính kèm.

Nguồn tham khảo

AI market AI chips-hardware-compute 2025-04-17 05:48:26

Phân tích chiến lược kiểm soát xuất khẩu của Mỹ nhằm duy trì ưu thế AI trước Trung Quốc

Mỹ triển khai các biện pháp kiểm soát xuất khẩu chip và thiết bị sản xuất chip nhằm cắt đứt nguồn cung cấp công nghệ AI tiên tiến cho Trung Quốc.
Từ năm 2022, Mỹ liên tục siết chặt kiểm soát, phối hợp với các nước như Nhật Bản, Hà Lan – những quốc gia nắm giữ công nghệ sản xuất thiết bị bán dẫn then chốt (ví dụ: ASML là công ty duy nhất sản xuất máy in thạch bản cực tím EUV).
Nhật Bản và Hà Lan đã công bố các biện pháp kiểm soát xuất khẩu riêng vào năm 2023 và đầu 2025, nhưng vẫn chưa nghiêm ngặt như Mỹ, tạo kẽ hở cho Trung Quốc nhập khẩu các thiết bị không nằm trong danh mục cấm.
Trung Quốc đã tận dụng thời gian trì hoãn giữa các đợt kiểm soát để nhập khẩu lượng lớn thiết bị: chỉ trong 7 tháng đầu năm 2024, Trung Quốc nhập tới 26 tỉ USD thiết bị sản xuất chip – mức kỷ lục, giúp các công ty như ASML, Tokyo Electron, Applied Materials hưởng lợi lớn.
Mỹ mở rộng quyền kiểm soát ngoại lãnh thổ (foreign direct product rule) từ tháng 12.2024, cho phép ngăn chặn cả thiết bị do nước ngoài sản xuất nếu chứa linh kiện hoặc công nghệ Mỹ, trừ các nước đồng minh đã có biện pháp kiểm soát tương đương.
Tuy nhiên, biện pháp này có thể gây căng thẳng ngoại giao, làm các nước như Nhật, Hà Lan khó chịu vì bị hạn chế quyền tự chủ, đồng thời thúc đẩy các công ty nước ngoài giảm phụ thuộc vào công nghệ Mỹ – về lâu dài có thể làm Mỹ mất đòn bẩy.
Trung Quốc vẫn gặp khó khăn lớn về sản xuất chip AI nội địa: chưa tự sản xuất được chip AI của Huawei, ngay cả DeepSeek – công ty AI lớn nhất Trung Quốc – cũng thừa nhận thiếu năng lực tính toán là rào cản lớn nhất.
Nếu Mỹ tiếp tục tăng thuế toàn cầu như Trump đề xuất, nguy cơ mất hợp tác từ các đồng minh châu Âu tăng lên, thể hiện qua việc cổ phiếu ASML giảm mạnh sau tuyên bố áp thuế mới.
Mỹ đứng trước lựa chọn khó: tiếp tục ngoại giao kiểm soát xuất khẩu để duy trì hợp tác, hay đơn phương áp đặt, chấp nhận rủi ro về ngoại giao và kinh tế.
Các giải pháp lý tưởng gồm: đồng minh cam kết tăng cường kiểm soát, chia sẻ thông tin, cấm bảo trì thiết bị tại Trung Quốc, và thường xuyên cập nhật danh sách nhà máy bị cấm.

📌 Mỹ đã khiến Trung Quốc phải nhập khẩu tới 26 tỉ USD thiết bị bán dẫn trong 7 tháng đầu 2024 nhờ phối hợp kiểm soát xuất khẩu với Nhật, Hà Lan. Tuy nhiên, nếu Mỹ hành động đơn phương, nguy cơ mất hợp tác và đòn bẩy công nghệ sẽ tăng, trong khi Trung Quốc vẫn chưa tự chủ được chip AI cao cấp.

https://www.foreignaffairs.com/united-states/how-america-can-stay-ahead-china-ai-race

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-04-16 05:41:30

Trung tâm dữ liệu AI-ready thay đổi thiết kế, phát triển bền vững và nhu cầu nhân lực

AI tạo sinh phát triển mạnh kéo theo nhu cầu trung tâm dữ liệu (data center) tăng đột biến, buộc các nhà vận hành phải thay đổi toàn diện thiết kế và hạ tầng truyền thống.
Hạ tầng cũ tại nhiều nơi như Thụy Điển không còn đáp ứng được yêu cầu phức tạp về làm mát, điện năng và hạn chế không gian khi tích hợp giải pháp AI, đặc biệt với giải pháp làm mát lai/hợp nhất hoặc liquid cooling.
Trung tâm dữ liệu AI-ready cần áp dụng tư duy thiết kế tổng thể: tích hợp từ đầu nguồn điện, làm mát, hệ thống cáp để đảm bảo khả năng mở rộng, linh hoạt, tránh sự cố do mở rộng hoặc sửa chữa ngắt quãng.
Giải pháp mô-đun được đánh giá cao, cho phép mở rộng dần bằng cách bổ sung các module nguồn và làm mát, đáp ứng các workload từ thấp đến trên 100kW/rack và giảm chi phí đầu tư ban đầu.
Việc sử dụng cáp chất lượng cao, đầu tư có chiến lược như các hyperscaler giúp giảm rủi ro và chi phí vận hành lâu dài, khuyến nghị các nhà cung cấp colocation học hỏi mô hình này.
Phát triển bền vững là thách thức lớn nhất: các trung tâm dữ liệu phải giảm dấu vết carbon, không chỉ mua chứng chỉ mà còn tận dụng nhiệt thải (như tích hợp hệ thống sưởi đô thị Stockholm), dùng năng lượng tái tạo, pin lưu trữ để ổn định lưới điện.
Khu vực địa lý ảnh hưởng đến lựa chọn giải pháp làm mát: miền Nam châu Âu thích hợp với immersive cooling hơn là liquid cooling truyền thống.
Nhu cầu nhân lực có kỹ năng về điện, làm mát, thiết kế hạ tầng vượt xa cung ứng, tạo ra thách thức lớn về đào tạo và an toàn lao động trong bối cảnh xây dựng nhanh.
Cần tăng cường truyền thông với cộng đồng nhằm xóa bỏ định kiến về tác động môi trường, làm rõ lợi ích kinh tế, vai trò trong trao đổi năng lượng tuần hoàn.
Thành công của trung tâm dữ liệu AI-ready không chỉ dựa trên hạ tầng mà còn cần tư duy tích hợp, phát triển kỹ năng, an toàn và gắn kết cộng đồng để không bị tụt hậu trong cuộc đua công nghệ.

📌 Trung tâm dữ liệu AI-ready yêu cầu thiết kế lại toàn diện, áp dụng mô-đun, làm mát hiện đại (hơn 100kW/rack), tận dụng năng lượng tái tạo và tối ưu truyền thông cộng đồng. Nhu cầu nhân lực có kỹ năng vượt xa cung ứng, an toàn lao động và phát triển bền vững là mối quan tâm hàng đầu khi AI phát triển thần tốc.

https://www.techradar.com/pro/ai-ready-data-centers-how-to-integrate-design-sustainability-and-people

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute STI 2025-04-16 05:23:51

TDK công bố đột phá quang học mới giúp tăng tốc truyền dữ liệu AI tạo sinh nhanh gấp 10 lần

TDK (Nhật Bản) vừa xác nhận phát triển thành công thiết bị “spin photo detector” đầu tiên thế giới, tích hợp công nghệ quang, điện tử và từ tính, đạt tốc độ phản hồi 20 picosecond (tương đương 20 phần nghìn tỷ giây).
Thiết bị này giúp truyền dữ liệu nhanh gấp 10 lần công nghệ điện tử hiện tại, giải quyết điểm nghẽn truyền dữ liệu lớn nhất của AI tạo sinh, thay thế cảm biến quang bán dẫn truyền thống.
Theo TDK, tốc độ truyền dữ liệu giữa các bộ xử lý AI hiện tại bị giới hạn nhiều hơn cả hiệu năng GPU, nên giải pháp này mang tính “thay đổi cuộc chơi” đối với ngành AI và trung tâm dữ liệu.
Giáo sư Arata Tsukamoto từ Đại học Nihon (Tokyo), người kiểm tra thiết bị, nhận định “spin photo detector” mở ra triển vọng lớn cả về khoa học lẫn công nghệ.
Khối lượng dữ liệu AI rất lớn khiến truyền dữ liệu điện tử không đáp ứng được nhu cầu, do đó TDK hướng đến giải pháp truyền dữ liệu bằng quang học, tận dụng tốc độ của ánh sáng.
TDK chuẩn bị tiến hành thêm các thử nghiệm xác nhận ổn định truyền quang liên tục với tốc độ siêu cao, dự kiến gửi mẫu cho khách hàng trước tháng 3/2026 và sản xuất quy mô lớn trong 3-5 năm tới.
Công nghệ mới này còn có tiềm năng giảm chi phí nhờ đơn giản hóa các bước xử lý wafer, giúp TDK có lợi thế cạnh tranh dù hệ sinh thái còn non trẻ.
Ngoài AI, thiết bị này còn ứng dụng tiềm năng trong kính thông minh thực tế ảo/tăng cường và cảm biến hình ảnh tốc độ cao.
Thị trường vi mạch quang tích hợp dự báo tăng hơn 10 lần trong thập kỷ tới, đạt 54,5 tỉ USD nhờ nhu cầu AI tạo sinh (theo IDTechEx).
TDK cạnh tranh trực tiếp với các tập đoàn lớn như Nvidia (đã mua Mellanox 7 tỉ USD năm 2020) và TSMC (đặt mục tiêu sản xuất công nghệ tương tự trong 5 năm).
Thiết bị mới còn giảm tiêu thụ điện năng, giải quyết bài toán tiết kiệm năng lượng cho trung tâm dữ liệu AI đang bùng nổ.

📌 TDK công bố cảm biến quang tích hợp “spin photo detector” phản hồi 20 picosecond, truyền dữ liệu AI nhanh gấp 10 lần hiện tại, giảm tiêu thụ điện và chi phí. Công nghệ dự kiến tạo doanh thu hàng chục tỉ USD, đẩy mạnh phát triển thị trường AI tạo sinh và vi mạch quang trong thập kỷ tới.

https://www.ft.com/content/f08da7af-be14-430e-845f-f46e84b321b8

#FT

TDK tuyên bố đột phá quang học để giải quyết nút thắt lớn nhất của AI tạo sinh

Thời gian phản hồi 20 phần nghìn tỷ giây được ghi nhận trong thử nghiệm nhằm cải thiện tốc độ truyền dữ liệu

Kết nối quang học có thể cung cấp truyền dữ liệu nhanh hơn nhiều so với các kết nối qua cáp sử dụng tín hiệu điện. © Alexis Jumeau/Abaca qua Reuters

Tác giả: Harry Dempsey tại Tokyo Công bố: 12 phút trước

Tập đoàn TDK của Nhật Bản đang tuyên bố một bước đột phá trong công nghệ quang học có khả năng xử lý dữ liệu nhanh hơn 10 lần so với các thiết bị điện tử hiện tại và giải quyết nút thắt cổ chai chính đang cản trở sự phát triển của trí tuệ nhân tạo tạo sinh.

Nhà cung cấp của Apple này cho biết họ đã chứng minh "bộ phát hiện quang spin" đầu tiên trên thế giới, kết hợp các yếu tố quang học, điện tử và từ tính để tạo ra thời gian phản hồi 20 picô giây, tức 20 phần nghìn tỷ giây, có tiềm năng thay thế các bộ phát hiện quang dựa trên bán dẫn hiện tại vốn truyền dữ liệu giữa các chip.

Hideaki Fukuzawa, giám đốc cấp cao của trung tâm phát triển sản phẩm thế hệ tiếp theo của TDK, cho biết tốc độ mà các bộ xử lý AI có thể truyền dữ liệu đang bị hạn chế nghiêm trọng bởi các thiết bị điện tử hiện tại.

"Việc truyền dữ liệu này là nút thắt lớn nhất đối với AI thay vì hiệu suất GPU bán dẫn," ông nói. "Vì chúng tôi có thể phá vỡ nhiều nút thắt hiện tại, chúng tôi nghĩ công nghệ này sẽ là một yếu tố thay đổi cuộc chơi cho ngành AI và trung tâm dữ liệu."

Arata Tsukamoto, giáo sư kỹ thuật điện tại Đại học Nihon ở Tokyo, đã thử nghiệm thiết bị mới cho TDK với tư cách đối tác nghiên cứu và cho biết ông tin rằng "bộ phát hiện quang spin có tiềm năng đáng chú ý, cả từ góc độ khoa học và công nghệ".

Hiện tại, dữ liệu được truyền giữa các bộ xử lý bằng tín hiệu điện, nhưng khối lượng lớn trong AI đòi hỏi sự chuyển đổi sang công nghệ quang học vì ánh sáng di chuyển nhanh hơn.

TDK có kế hoạch thử nghiệm thêm để xác nhận ánh sáng liên tục ở tốc độ siêu cao, trước khi cung cấp mẫu cho khách hàng vào cuối tháng 3/2026 và bắt đầu sản xuất hàng loạt trong ba đến năm năm tới.

Mặc dù công nghệ còn chưa hoàn thiện và còn thách thức lớn trong việc xây dựng một hệ sinh thái cho công nghệ này với các nhà thiết kế mạch tích hợp, TDK tin rằng thiết bị của họ có thể có lợi thế về chi phí so với các giải pháp khác bằng cách giảm số lượng quy trình xử lý tấm wafer.

TDK cung cấp pin cho iPhone, nhưng họ đã điều chỉnh công nghệ đầu đọc từ tính cho ổ đĩa cứng để đạt được bước đột phá trong lĩnh vực quang tử.

Thiết bị mới của họ cũng sử dụng ít năng lượng hơn - một vấn đề quan trọng khác trong việc mở rộng trung tâm dữ liệu AI. Kính thông minh cho thực tế tăng cường và thực tế ảo, cũng như cảm biến hình ảnh tốc độ cao cũng là những thị trường tiềm năng trong tương lai cho công nghệ này.

Thiết bị này là một phần của thị trường mạch tích hợp quang tử, dự kiến sẽ mở rộng hơn 10 lần trong thập kỷ tới lên 54,5 tỷ đô la do nhu cầu của AI tạo sinh, theo dự báo của nhóm nghiên cứu công nghệ IDTechEx.

Các công ty AI lớn cũng đang nỗ lực phát triển bộ thu phát tích hợp công nghệ quang học vào các gói chip của họ và công nghệ của TDK sẽ là một đối thủ cạnh tranh với công nghệ quang tử silicon thế hệ tiếp theo như vậy.

Nhà sản xuất chip lớn nhất thế giới, Công ty Sản xuất Bán dẫn Đài Loan (TSMC), đang thúc đẩy, với mục tiêu sản xuất trong vòng năm năm.

Nvidia cũng báo hiệu tầm quan trọng của việc giải quyết nút thắt truyền dữ liệu khi họ chi 7 tỷ đô la vào năm 2020 để mua lại Mellanox Technologies của Israel, một chuyên gia trong việc cho phép kết nối hiệu quả giữa các mạng, hệ thống và trung tâm dữ liệu.

TDK claims optical breakthrough to tackle generative AI’s biggest bottleneck

Response times of 20 trillionths of a second recorded in test to improve data transfer speeds

Harry Dempsey in Tokyo

Published12 minutes ago

Stay informed with free updates

Simply sign up to the Artificial intelligence myFT Digest -- delivered directly to your inbox.

Japan’s TDK is claiming a breakthrough in optical technology that would process data 10 times faster than current electronics and solve a key bottleneck holding back the growth of generative artificial intelligence.

The Apple supplier says it has demonstrated the world’s first “spin photo detector”, combining optical, electronic and magnetic elements to create response times of 20 picoseconds, or 20 trillionths of a second, potentially replacing existing semiconductor-based photo detectors that transfer data between chips.

Hideaki Fukuzawa, senior manager of TDK’s next-generation products development centre, said the speed at which AI processors could transfer data was severely limited by current electronics.

“This data transfer is the biggest bottleneck for AI rather than the semiconductor GPU performance,” he said. “Since we can break through many of the current bottlenecks, we think this technology will be a game-changer for the AI and data centre industry.”

Arata Tsukamoto, an electrical engineering professor at Tokyo’s Nihon University, tested the new device for TDK as its research partner and said he believed “the spin photo detector holds remarkable promise, both from a scientific and technological perspective”.

Data is currently transferred between processors by electrical signals, but the large volumes in AI require a shift towards optical technology because light travels faster.

TDK plans further tests to confirm continuous light at ultra-high speeds, before providing samples to customers by the end of March 2026 and entering mass production in the next three to five years.

Despite the immaturity of the technology and the major challenge of building an ecosystem for the tech with integrated circuit designers, TDK believes its device could have a cost advantage over other solutions by reducing the number of wafer processes.

TDK supplies batteries for the iPhone, but it has adapted its magnetic heads technology for hard disc drives to achieve the photonics breakthrough.

Its new device also uses less power — another key issue in AI data centre expansion. Smart glasses for augmented and virtual reality and high-speed image sensors are also potential future markets for the technology.

The device is part of the photonic integrated circuits market, set to expand more than tenfold over the next decade to $54.5bn due to generative AI’s demands, according to forecasts by tech research group IDTechEx.

Major AI companies have also been striving to develop transceivers that integrate optical technology into their chip packages and TDK’s tech would be a challenger to such next-generation silicon photonics.

The world’s largest chipmaker, Taiwan Semiconductor Manufacturing Company, is making a push, aiming for production within five years.

Nvidia also signalled the importance of solving the data transfer bottleneck when it paid $7bn in 2020 to acquire Israel’s Mellanox Technologies, a specialist in enabling efficient connections between networks, systems and data centres.

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-04-15 06:35:05

Cuộc đại di cư công nghệ: Nvidia rót 500 tỷ USD đưa sản xuất AI từ Đài Loan về Mỹ

Nvidia công bố kế hoạch xây dựng cơ sở hạ tầng AI trị giá lên đến 500 tỷ USD tại Mỹ trong 4 năm tới với sự hỗ trợ từ các đối tác như TSMC, Foxconn và Wistron.
Thông báo này bao gồm việc sản xuất chip AI Blackwell tại nhà máy của TSMC ở Phoenix, Arizona, cũng như các nhà máy sản xuất siêu máy tính ở Texas do Foxconn và Wistron điều hành, dự kiến sẽ tăng cường hoạt động trong 12 đến 15 tháng tới.
Động thái này đưa gã khổng lồ chip AI - công ty hiện sản xuất phần lớn bộ xử lý tại Đài Loan - vào hàng ngũ các công ty công nghệ cam kết đưa hoạt động sản xuất trở lại Mỹ trước mối đe dọa áp thuế cao từ tổng thống Donald Trump.
Apple, công ty lắp ráp phần lớn iPhone tại Trung Quốc, cũng đã hứa đầu tư 500 tỷ USD tại Mỹ trong 4 năm tới, bao gồm một nhà máy ở Texas cho máy chủ trí tuệ nhân tạo.
Jensen Huang, CEO của Nvidia, cho biết: "Việc bổ sung sản xuất tại Mỹ giúp chúng tôi đáp ứng tốt hơn nhu cầu ngày càng tăng về chip AI và siêu máy tính, củng cố chuỗi cung ứng và tăng cường khả năng phục hồi của chúng tôi."
Công ty cho biết việc sản xuất chip AI và siêu máy tính tại Mỹ sẽ tạo ra hàng trăm nghìn việc làm trong những thập kỷ tới.
Vào tháng 3, Huang đã nói rằng Nvidia thấy tác động ngắn hạn ít từ thuế quan cao hơn của Mỹ, nhưng sẽ chuyển sản xuất sang Mỹ trong dài hạn, mà không đưa ra khung thời gian cụ thể.
Nvidia xác nhận TSMC đã bắt đầu sản xuất thế hệ chip mới nhất tại nhà máy ở Arizona. Reuters đã đưa tin vào tháng 12 rằng TSMC đang đàm phán với Nvidia để sản xuất chip Blackwell tại nhà máy này.
TSMC, nhà sản xuất chip theo hợp đồng lớn nhất thế giới, cho biết họ có kế hoạch đầu tư mới 100 tỷ USD tại Mỹ, bao gồm xây dựng năm cơ sở sản xuất chip bổ sung.

📌 Nvidia chuyển hướng sản xuất về Mỹ với kế hoạch đầu tư 500 tỷ USD trong 4 năm, sản xuất chip Blackwell tại nhà máy TSMC ở Arizona và xây dựng nhà máy siêu máy tính tại Texas, tạo ra hàng trăm nghìn việc làm và củng cố vị thế trong cuộc đua AI toàn cầu.

https://www.reuters.com/technology/artificial-intelligence/nvidia-says-working-with-partners-make-ai-supercomputers-us-2025-04-14/

Không có file đính kèm.

Nguồn tham khảo

139

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-04-15 05:50:25

Microsoft giảm tốc độ đầu tư vào AI: Điều chỉnh chiến lược hay tín hiệu suy thoái thị trường?

Microsoft gần đây thông báo có thể "điều chỉnh chiến lược" kế hoạch trung tâm dữ liệu của mình, một động thái đáng chú ý trong bối cảnh cuộc đua phát triển cơ sở hạ tầng AI đang diễn ra mạnh mẽ.
Noelle Walsh, giám đốc điều hành Microsoft Cloud Operations, cho biết công ty đang "làm chậm hoặc tạm dừng một số dự án ở giai đoạn đầu" sau 2 năm mở rộng nhanh chóng để đáp ứng nhu cầu dịch vụ đám mây và AI.
Theo phân tích của TD Cowen, Microsoft đã rút khỏi hơn 2 gigawatt công suất điện toán đám mây AI ở cả Mỹ và châu Âu trong 6 tháng qua, đồng thời hoãn và hủy các hợp đồng thuê trung tâm dữ liệu hiện có.
Sự điều chỉnh này một phần do thay đổi trong quan hệ đối tác với OpenAI, cho phép công ty này làm việc với các nhà cung cấp đám mây khác ngoài Microsoft, giảm nhu cầu về cơ sở hạ tầng đào tạo mô hình AI mới.
Mặc dù có vẻ như đang giảm tốc, Microsoft vẫn duy trì kế hoạch chi tiêu vốn 80 tỷ đô la trong năm tài khóa 2025 và dự kiến tăng trưởng trong năm tài khóa tiếp theo.
Chiến lược của Microsoft đang chuyển từ "giành đất" (mua đất và xây dựng) sang tập trung vào việc mua GPU và thiết bị điện toán để lắp đặt trong các trung tâm dữ liệu hiện có.
Một xu hướng quan trọng là sự chuyển dịch từ đào tạo AI (tạo mô hình mới, đòi hỏi nhiều GPU kết nối chặt chẽ và mạng tiên tiến) sang suy luận AI (chạy các mô hình hiện có để hỗ trợ dịch vụ).
Công ty khởi nghiệp AI Cohere đã thể hiện hiệu quả này khi mô hình Command A mới chỉ cần 2 GPU để vận hành, ít hơn nhiều so với hầu hết các mô hình trong những năm gần đây.
Mustafa Suleyman, CEO của Microsoft AI, khẳng định mức tiêu thụ điện toán vẫn "không thể tin được", nhưng đang chuyển sang các giai đoạn khác của quy trình AI.
Khi Microsoft rút lui khỏi một số thị trường, các đối thủ như Google và Meta đã nhanh chóng chiếm lĩnh công suất được bỏ trống, cho thấy cạnh tranh trong lĩnh vực hyperscaler vẫn rất cao.

📌 Microsoft không rút lui khỏi cuộc đua AI mà đang điều chỉnh chiến lược, tập trung vào hiệu quả chi phí với sự chuyển dịch từ đào tạo AI sang suy luận AI. Dù hủy một số dự án ban đầu, công ty vẫn duy trì kế hoạch chi tiêu 80 tỷ đô la trong năm 2025, chứng tỏ đây là bước điều chỉnh thông minh, không phải sự suy thoái của thị trường AI.

https://www.businessinsider.com/microsoft-ai-data-center-cloud-decreased-spending-explained-why-2025-4

Microsoft đang giảm tốc độ phát triển AI. Điều đó có ý nghĩa gì?

Phân tích bởi Alistair Barr Ngày 14 tháng 4 năm 2025, 9:02 AM UTC

Microsoft gần đây cho biết có thể "điều chỉnh chiến lược" kế hoạch trung tâm dữ liệu của mình. Sự thay đổi này diễn ra sau khi có sự chuyển biến trong quan hệ đối tác với OpenAI và lo ngại về khả năng cung cấp quá mức. Sự thay đổi của Microsoft phản ánh xu hướng rộng lớn hơn trong ngành công nghiệp từ việc đào tạo AI sang suy luận hiệu quả hơn về chi phí.

Trong cuộc đua quyết liệt để thống trị cơ sở hạ tầng AI, một gã khổng lồ công nghệ đã âm thầm chuyển hướng.

Kể từ khi ChatGPT xuất hiện vào cuối năm 2022, đã có một cuộc chạy đua xây dựng càng nhiều trung tâm dữ liệu AI càng tốt. Các công ty công nghệ lớn đang chi hàng trăm tỷ đô la vào đất đai, xây dựng và thiết bị tính toán để hỗ trợ khối lượng công việc AI tạo sinh mới.

Microsoft đã đi đầu trong lĩnh vực này, chủ yếu thông qua quan hệ đối tác với OpenAI, nhà sáng tạo ChatGPT.

Trong hai năm qua, hầu như không có nghi ngờ gì trong ngành công nghệ về sự mở rộng AI này. Mọi thứ đều phát triển mạnh mẽ.

Cho đến gần đây.

Điều chỉnh kế hoạch

Vào thứ Ba tuần trước, Noelle Walsh, người đứng đầu Microsoft Cloud Operations, cho biết công ty "có thể điều chỉnh chiến lược kế hoạch của chúng tôi."

Đây là tin gây sốc đối với ngành công nghiệp AI vốn liên tục đòi hỏi thêm năng lực đám mây và GPU Nvidia. Vì vậy, đáng để đọc kỹ những gì Walsh viết về cách mọi thứ đã thay đổi:

"Trong những năm gần đây, nhu cầu về dịch vụ đám mây và AI của chúng tôi đã tăng trưởng hơn nhiều so với dự đoán và để đáp ứng cơ hội này, chúng tôi bắt đầu thực hiện dự án mở rộng cơ sở hạ tầng lớn nhất và tham vọng nhất trong lịch sử của chúng tôi," cô ấy viết trong một bài đăng trên LinkedIn.

"Về bản chất, bất kỳ nỗ lực mới đáng kể nào ở quy mô này đều đòi hỏi sự linh hoạt và tinh chỉnh khi chúng tôi học hỏi và phát triển cùng với khách hàng. Điều này có nghĩa là chúng tôi đang làm chậm lại hoặc tạm dừng một số dự án ở giai đoạn đầu," Walsh bổ sung.

Microsoft gần đây đã giảm tốc độ một chút

Cô ấy không chia sẻ thêm chi tiết, nhưng Michael Elias, nhà phân tích của TD Cowen, đã tìm thấy một số ví dụ gần đây về những gì ông gọi là sự rút lui của Microsoft.

Gã khổng lồ công nghệ đã từ bỏ hơn 2 gigawatt công suất đám mây AI ở cả Mỹ và châu Âu trong 6 tháng qua đang trong quá trình thuê, ông nói. Trong khoảng một tháng qua, Microsoft cũng đã hoãn và hủy bỏ các hợp đồng thuê trung tâm dữ liệu hiện có ở Mỹ và châu Âu, Elias viết trong một ghi chú gần đây gửi cho các nhà đầu tư.

Sự rút lui này về việc thuê công suất mới phần lớn do quyết định của Microsoft không hỗ trợ thêm khối lượng đào tạo OpenAI, Elias nói. Một thay đổi gần đây đối với quan hệ đối tác quan trọng này cho phép OpenAI làm việc với các nhà cung cấp đám mây khác ngoài Microsoft.

"Tuy nhiên, chúng tôi tiếp tục tin rằng việc hủy hợp đồng thuê và hoãn công suất cho thấy trung tâm dữ liệu cung cấp quá mức so với dự báo nhu cầu hiện tại của họ," Elias bổ sung.

Điều này đáng lo ngại vì hàng nghìn tỷ đô la đầu tư hiện tại và kế hoạch đang phụ thuộc vào việc bùng nổ AI tạo sinh tiếp tục với tốc độ nhanh chóng. Với quá nhiều tiền đang được đặt cược, bất kỳ dấu hiệu nào cho thấy con tàu phóng này không bay lên với tốc độ ánh sáng đều khiến người ta lo lắng.

Một sự điều chỉnh lại AI, không phải rút lui

Tuy nhiên, thực tế phức tạp hơn việc đơn giản là rút lui. Những gì chúng ta đang chứng kiến là một sự điều chỉnh lại - không phải rút lui.

Nhà phân tích Raimo Lenschow của Barclays đặt tình huống vào bối cảnh. Làn sóng đầu tiên của đợt chi tiêu ngành công nghiệp này tập trung nhiều vào việc bảo đảm đất đai và tòa nhà để chứa tất cả các chip và thiết bị tính toán khác cần thiết để tạo ra và chạy các mô hình và dịch vụ AI.

Là một phần của "cuộc đua giành đất" AI này, các công ty đám mây lớn thường ký kết và đàm phán các hợp đồng thuê mà sau đó họ từ bỏ, Lenschow giải thích.

Giờ đây, khi Microsoft cảm thấy thoải mái hơn với số lượng đất đai họ sở hữu, công ty có khả năng đang chuyển một số chi tiêu sang các giai đoạn sau tập trung nhiều hơn vào việc mua GPU và thiết bị tính toán khác đặt bên trong các trung tâm dữ liệu mới này.

"Nói cách khác, trong một vài quý vừa qua, Microsoft đã 'chi tiêu quá mức' cho đất đai và tòa nhà, nhưng giờ đang trở lại nhịp độ bình thường hơn," Lenschow viết trong một ghi chú gần đây gửi cho các nhà đầu tư.

Microsoft vẫn dự định chi 80 tỷ đô la cho chi tiêu vốn trong năm tài chính 2025 và đã định hướng tăng trưởng so với cùng kỳ năm tài chính tiếp theo. Vì vậy, có lẽ công ty không từ bỏ AI nhiều, mà đang trở nên chiến lược hơn về nơi và cách đầu tư.

Từ đào tạo AI đến suy luận

Một phần của sự thay đổi dường như là từ đào tạo AI sang suy luận. Tiền đào tạo là cách tạo ra các mô hình mới, và điều này đòi hỏi nhiều GPU được kết nối chặt chẽ, cùng với mạng lưới hiện đại. Đồ đắt tiền! Suy luận là cách chạy các mô hình hiện có để hỗ trợ các dịch vụ như AI agents và Copilots. Suy luận ít đòi hỏi kỹ thuật hơn nhưng được kỳ vọng sẽ là thị trường lớn hơn.

Với suy luận vượt qua đào tạo, trọng tâm đang chuyển sang cơ sở hạ tầng có thể mở rộng, hiệu quả về chi phí để tối đa hóa lợi nhuận đầu tư.

Ví dụ, tại một hội nghị AI gần đây ở New York, cuộc thảo luận tập trung nhiều hơn vào hiệu quả thay vì đạt được AGI, hay trí tuệ nhân tạo tổng quát, một nỗ lực tốn kém để khiến máy móc hoạt động tốt hơn con người.

Startup AI Cohere lưu ý rằng mô hình Command A mới của họ chỉ cần hai GPU để chạy. Đó là ít hơn rất nhiều so với hầu hết các mô hình đã yêu cầu trong những năm gần đây.

Người đứng đầu AI của Microsoft cân nhắc

Mustafa Suleyman, CEO của Microsoft AI, đã nhấn mạnh điều này trong một podcast gần đây. Mặc dù ông thừa nhận có sự chậm lại nhẹ trong lợi nhuận từ các lần chạy tiền đào tạo lớn, ông nhấn mạnh rằng mức tiêu thụ điện toán của công ty vẫn "không thể tin được" - nó chỉ đang chuyển sang các giai đoạn khác nhau của quy trình AI.

Suleyman cũng làm rõ rằng một số hợp đồng thuê và dự án đã hủy bỏ chưa bao giờ là hợp đồng hoàn chỉnh, mà chỉ là các cuộc thảo luận thăm dò - một phần của quy trình hoạt động tiêu chuẩn trong kế hoạch đám mây siêu quy mô.

Sự chuyển hướng chiến lược này diễn ra khi OpenAI, đối tác thân thiết của Microsoft, đã bắt đầu tìm nguồn công suất từ các nhà cung cấp đám mây khác, và thậm chí đang ám chỉ việc phát triển trung tâm dữ liệu riêng. Tuy nhiên, Microsoft vẫn duy trì quyền ưu tiên từ chối đối với công suất OpenAI mới, báo hiệu sự tích hợp sâu rộng liên tục giữa hai công ty.

Tất cả điều này có nghĩa là gì?

Thứ nhất, đừng nhầm lẫn sự linh hoạt với điểm yếu. Microsoft có lẽ đang điều chỉnh theo động lực thị trường thay đổi, không phải thu hẹp tham vọng. Thứ hai, không gian siêu quy mô vẫn cực kỳ cạnh tranh.

Theo Elias, khi Microsoft từ bỏ công suất ở thị trường nước ngoài, Google đã nhanh chóng nắm bắt nguồn cung. Trong khi đó, Meta đã lấp đầy công suất mà Microsoft để lại trên bàn ở Mỹ.

"Cả hai siêu quy mô này đang trong giai đoạn tăng cường đáng kể nhu cầu trung tâm dữ liệu so với năm trước," Elias viết, ám chỉ Google và Meta.

Vì vậy, sự thay đổi của Microsoft có thể là dấu hiệu của sự trưởng thành, hơn là rút lui. Khi việc áp dụng AI bước vào giai đoạn tiếp theo, người chiến thắng không nhất thiết là người chi tiêu nhiều nhất - mà là người chi tiêu thông minh nhất.

Không có file đính kèm.

Nguồn tham khảo

AI edge AI smartphone AI chips-hardware-compute AI PC 2025-04-15 05:07:39

SoC Dimensity 9400+ mới của MediaTek với khả năng AI agent và tạo sinh trên thiết bị

MediaTek vừa công bố Dimensity 9400+, phiên bản mới nhất trong dòng chipset Dimensity cao cấp, được thiết kế cho thiết bị Android thế hệ tiếp theo với khả năng AI tạo sinh và AI tác nhân.
Tại trung tâm của Dimensity 9400+ là kiến trúc CPU All Big Core, bao gồm một lõi Arm Cortex-X925 xung nhịp lên đến 3,73GHz, ba lõi Cortex-X4 và bốn lõi Cortex-A720, nâng cao hiệu suất đa luồng và đơn luồng.
JC Hsu, Phó Chủ tịch Tập đoàn MediaTek, cho biết: "Dimensity 9400+ sẽ giúp mang đến trải nghiệm AI cá nhân hóa, sáng tạo trên thiết bị, kết hợp với hiệu suất nâng cao đảm bảo thiết bị xử lý mọi tác vụ dễ dàng."
Nền tảng AI của chip là MediaTek NPU 890, hỗ trợ nhiều mô hình ngôn ngữ lớn (LLM) và các framework AI tiên tiến như Mixture-of-Experts (MoE), Multi-Head Latent Attention (MLA), Multi-Token Prediction (MTP) và suy luận FP8.
Dimensity 9400+ cung cấp hiệu suất AI tác nhân nhanh hơn 20% nhờ công nghệ Speculative Decoding+ (SpD+) và Dimensity Agentic AI Engine (DAE), đơn giản hóa việc phát triển ứng dụng thông minh, thích ứng và thời gian thực.
Chip trang bị GPU Arm Immortalis-G925 12 lõi, mang đến đồ họa cấp độ PC với các tính năng như opacity micromap (OMM) cho hiệu ứng thực tế của các yếu tố trong game như thực vật, tóc và lông vũ.
Dimensity 9400+ duy trì tốc độ chơi game đỉnh cao trong các phiên dài hơn và giới thiệu bộ chuyển đổi tốc độ khung hình MFRC 2.0+ của MediaTek, nhân đôi FPS hiệu quả và cải thiện hiệu suất năng lượng lên đến 40%.
Về khả năng xử lý hình ảnh, Imagiq 1090 ISP cho phép quay video HDR trong toàn dải zoom, trong khi Smooth Zoom cho phép lấy nét mượt mà trên các đối tượng chuyển động và thu âm có chọn lọc.
Chip mới đánh dấu xu hướng phát triển của AI trên thiết bị, khi các nhà sản xuất chip như MediaTek đang xây dựng nền tảng cho một tương lai nơi các thiết bị có thể dự đoán và thực hiện các tác vụ phức tạp một cách tự động.
Dimensity 9400+ hướng tới việc cung cấp trải nghiệm Android đáp ứng và đắm chìm hơn, kết hợp hiệu suất cao với tính năng AI tiên tiến.

📌 Dimensity 9400+ của MediaTek mở ra kỷ nguyên mới cho AI trên thiết bị với CPU All Big Core, hiệu suất AI tác nhân nhanh hơn 20%, và GPU 12 lõi cung cấp đồ họa cấp PC. Chip này tối ưu hóa cả hiệu năng và tiết kiệm năng lượng, hứa hẹn trải nghiệm Android đột phá.

https://www.rcrwireless.com/20250411/chips/mediatek-ai-soc

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-04-15 05:03:35

Cơ sở hạ tầng AI và cuộc cách mạng kinh tế tiếp theo

AI đang bước vào giai đoạn cách mạng kinh tế tiếp theo, giống như điện từng làm thay đổi công nghiệp. Thay vì chỉ là giải pháp điểm, AI cần tích hợp hệ thống để thay đổi tận gốc cách tổ chức hoạt động.
Cơ sở hạ tầng AI bao gồm 6 lĩnh vực cốt lõi: nền tảng dữ liệu, mô hình AI, phần cứng trung tâm dữ liệu, mạng lưới, chất bán dẫn và bộ nhớ/lưu trữ. Tất cả phải hoạt động đồng bộ để đảm bảo hiệu suất, độ mở rộng và hiệu quả.
Cách mạng AI hiện tại được thúc đẩy bởi GPU hiệu năng cao, dữ liệu khổng lồ và cải tiến thuật toán, chuyển từ học máy sang học sâu, và hiện là AI tạo sinh như LLMs, ChatGPT.
NVIDIA mô tả quy trình phát triển AI gồm 4 bước: chuẩn bị dữ liệu, huấn luyện mô hình, tối ưu hóa và triển khai suy luận. Các tổ chức lớn như Mercedes-Benz, Deutsche Bank hay ngành dược đã chứng minh lợi ích thực tế của AI.
Luật mở rộng AI (scaling laws) từ OpenAI và DeepMind chứng minh rằng hiệu suất AI tỷ lệ thuận với quy mô mô hình, dữ liệu và tài nguyên tính toán. Đầu tư càng lớn, hiệu quả kinh tế càng siêu cấp.
Alphabet, Amazon, Meta và Microsoft dự kiến đầu tư 315 tỷ USD vào AI trong năm 2025. OpenAI và đối tác còn lập Dự án Stargate trị giá 500 tỷ USD để xây dựng trung tâm dữ liệu AI khổng lồ tại Texas, với cụm GPU lên đến 100.000.
Trung tâm dữ liệu đang chuyển mình thành trung tâm AI, với 80% đơn vị vận hành lên kế hoạch tăng dung lượng, tăng mật độ rack, dùng làm mát bằng chất lỏng, năng lượng mặt trời, thậm chí cả hạt nhân để đáp ứng nhu cầu điện năng AI ngày càng lớn.
Edge AI đang nổi lên như xu hướng tất yếu. AI không chỉ chạy trên đám mây mà còn cần triển khai tại thiết bị, nơi dữ liệu được tạo ra – giúp tiết kiệm chi phí, tăng quyền riêng tư và độ trễ thấp.
Các kỹ thuật suy luận ở thời điểm kiểm tra (test-time inference scaling) đang giúp AI điều chỉnh tài nguyên linh hoạt tùy theo bài toán, tăng hiệu quả vận hành.
Agentic AI, nơi các AI hoạt động tự động như “đại lý” tại biên (edge), là tương lai. Dell, Qualcomm, Intel và Verizon đều nhắm đến hệ sinh thái hybrid AI, nơi AI hoạt động xuyên suốt từ thiết bị đến biên, lên đám mây.
DeepSeek (Trung Quốc) huấn luyện LLM mạnh chỉ với chi phí khoảng 6 triệu USD (không bao gồm GPU), gây rúng động thị trường. Điều này kích hoạt lại “Nghịch lý Jevons” – càng tối ưu thì nhu cầu lại càng tăng.
Cuộc đua AI giờ là cuộc chạy đua địa chính trị Mỹ - Trung về AI và sức mạnh tính toán. Dù chưa có AGI thật sự, các quốc gia đang đầu tư như thể đó là điều chắc chắn.

📌 AI đang trở thành cơ sở hạ tầng trung tâm cho cách mạng kinh tế toàn cầu. Chỉ riêng 4 Big Tech đã chi 315 tỷ USD trong năm 2025 cho hạ tầng AI. Dự án Stargate của OpenAI thêm 500 tỷ USD trong 5 năm. Edge AI, agentic AI và test-time inference scaling mở ra kỷ nguyên AI phân tán. Dù AGI còn gây tranh cãi, cơ sở hạ tầng AI đang được xây dựng như thể đó là tương lai không thể tránh khỏi.

https://www.rcrwireless.com/20250411/ai-infrastructure/ai-infra-revolution

Cơ sở hạ tầng AI bao gồm 6 lĩnh vực cốt lõi:

1. Nền tảng dữ liệu (Data Platforms)

Vai trò: Là nền móng của toàn bộ hệ thống AI. Nếu dữ liệu không chất lượng, mô hình AI sẽ học sai hoặc vô ích.
Các chức năng chính:
- Tích hợp dữ liệu: Kết nối nhiều nguồn dữ liệu (IoT, CRM, cảm biến, hệ thống quản trị…).
- Quản trị và chuẩn hóa: Đảm bảo dữ liệu có cấu trúc tốt, đúng định dạng, đầy đủ và không trùng lặp.
- Điều phối dữ liệu (Orchestration): Tự động hóa luồng xử lý dữ liệu từ thu thập – làm sạch – chuyển đổi – lưu trữ – phân phối.
Công nghệ tiêu biểu: Delta Lake, Apache Kafka, Snowflake, Databricks.

2. Mô hình AI (AI Models)

Vai trò: Là “bộ não” của hệ thống, phân tích dữ liệu để đưa ra dự đoán, nhận dạng, tạo sinh nội dung hoặc ra quyết định.
Phân loại:
- Machine Learning truyền thống: như hồi quy tuyến tính, cây quyết định, SVM.
- Deep Learning: dùng mạng nơ-ron sâu để xử lý hình ảnh, âm thanh, văn bản.
- Generative AI và LLMs: như GPT, Claude, LLaMA, Gemini – tạo ra văn bản, hình ảnh, âm nhạc, code, v.v.
Đặc điểm quan trọng: AI ngày càng đa phương thức (multimodal) và có khả năng tương tác tự nhiên hơn.

3. Phần cứng trung tâm dữ liệu (Data Center Hardware)

Vai trò: Cung cấp sức mạnh tính toán cần thiết để huấn luyện và suy luận AI, nhất là các mô hình lớn.
Thành phần:
- GPU, TPU, NPU: gia tốc tính toán AI hàng đầu.
- Cụm HPC (High Performance Computing): các hệ thống tính toán hiệu năng cao dùng cho AI đào tạo quy mô lớn.
- Hệ thống làm mát: gồm điều hòa không khí, làm mát bằng chất lỏng, hoặc nhúng máy chủ trong dung dịch (immersion cooling).
Xu hướng: thiết kế trung tâm dữ liệu AI chuyên biệt với mật độ rack cao, tối ưu luồng gió, tiết kiệm điện.

4. Mạng lưới (Networking)

Vai trò: Truyền tải khối lượng dữ liệu khổng lồ giữa các máy chủ, thiết bị biên và đám mây.
Yêu cầu:
- Băng thông cực cao để xử lý thời gian thực.
- Độ trễ thấp để AI phản ứng nhanh trong các ứng dụng như xe tự lái, camera thông minh.
Công nghệ tiêu biểu: Ethernet tốc độ 400G, kết nối quang học, 5G private, Edge-to-Cloud Fabric.
Mạng lưới phân tán: cần thiết cho AI tại biên, IoT và ứng dụng trong nhà máy, bệnh viện, xe tự hành.

5. Chất bán dẫn (Semiconductors)

Vai trò: Là "bộ cơ" trong hệ thống AI, đảm nhiệm tính toán, xử lý đồ họa, suy luận hoặc huấn luyện.
Phân loại chip AI:
- CPU: Xử lý tổng hợp, thường được dùng phối hợp.
- GPU: Rất mạnh cho huấn luyện và suy luận AI, như NVIDIA A100, H100.
- TPU (Tensor Processing Unit): do Google phát triển chuyên cho AI.
- ASIC và FPGA: cho ứng dụng chuyên biệt.
Xu hướng: ngày càng tăng tốc độ, giảm tiêu thụ điện năng, tích hợp AI-native.

6. Bộ nhớ và lưu trữ (Memory and Storage)

Vai trò: Đảm bảo AI có thể truy xuất nhanh chóng lượng dữ liệu cực lớn trong huấn luyện và suy luận.
Thành phần chính:
- HBM (High Bandwidth Memory): bộ nhớ tốc độ siêu cao gắn trực tiếp vào GPU.
- DDR5 RAM: bộ nhớ chính nhanh hơn, nhiều luồng.
- NVMe SSD: ổ cứng tốc độ cực nhanh, phù hợp truy xuất mô hình và dữ liệu thời gian thực.
Vấn đề hiện tại: tường bộ nhớ (memory wall) – tốc độ tính toán nhanh hơn tốc độ truyền dữ liệu từ bộ nhớ → giải pháp đang là xử lý trong bộ nhớ (PIM) và tối ưu pipeline lưu trữ.

6 lĩnh vực trên tạo thành một hệ sinh thái cơ sở hạ tầng AI liên kết chặt chẽ. Không một lĩnh vực nào có thể hoạt động hiệu quả nếu thiếu các thành phần còn lại. Để mở rộng AI toàn cầu một cách bền vững, các doanh nghiệp và quốc gia phải đầu tư đồng đều cả về dữ liệu, tính toán, mạng lưới, bộ nhớ và mô hình. Cơ sở hạ tầng AI không chỉ là nền móng, mà còn là yếu tố quyết định tốc độ, khả năng mở rộng và tác động của AI đến nền kinh tế số.

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-04-10 23:08:09

Google ra mắt chip Ironwood TPU mới tập trung vào suy luận AI

- Google vừa công bố phiên bản mới nhất của Tensor Processing Unit (TPU) tại sự kiện Google Cloud Next 25.

- Chip Ironwood TPU lần đầu tiên được định vị cho suy luận AI, thay vì huấn luyện như các phiên bản trước.

- Sự chuyển hướng này phản ánh xu hướng AI đang chuyển từ dự án nghiên cứu sang ứng dụng thực tế trong doanh nghiệp.

- Sự gia tăng của các mô hình AI "lý luận" như Gemini đã tạo ra nhu cầu tính toán và chi phí khổng lồ cho suy luận.

- Ironwood mang lại hiệu suất gấp đôi so với phiên bản Trillium trước đó, đạt 29,3 nghìn tỷ phép tính dấu phẩy động mỗi giây.

- Chip mới có 192GB bộ nhớ DRAM, gấp 6 lần Trillium, với băng thông truyền tải 7,2 terabit/giây, gấp 4,5 lần.

- Google nhấn mạnh khả năng mở rộng của Ironwood, có thể kết hợp hàng trăm nghìn chip để tăng tốc hiệu suất.

- Việc tập trung vào chip suy luận đánh dấu sự thay đổi trong chiến lược của Google, giảm phụ thuộc vào Intel, AMD và Nvidia.

- Các nhà phân tích cho rằng TPU có thể giúp Google tiết kiệm chi phí cơ sở hạ tầng AI đang tăng vọt.

- Google cũng công bố phần mềm Pathways on Cloud để phân phối công việc tính toán AI trên nhiều máy tính.

- Sự ra mắt của Ironwood phản ánh nhu cầu ngày càng tăng về suy luận AI trong thời gian thực cho hàng triệu người dùng.

📌 Chip Ironwood TPU mới của Google đánh dấu bước ngoặt quan trọng, tập trung vào tối ưu hóa chi phí suy luận AI. Với hiệu suất gấp đôi và bộ nhớ gấp 6 lần phiên bản trước, Ironwood hứa hẹn mang lại tiềm năng lớn cho việc mở rộng quy mô AI trong thực tế.

https://www.zdnet.com/article/googles-latest-chip-is-all-about-reducing-one-huge-hidden-cost-in-ai/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-04-10 10:14:08

Báo cáo trung tâm dữ liệu toàn cầu 2025 tiết lộ sự bùng nổ đầu tư, tăng trưởng AI

Báo cáo cho thấy ngành trung tâm dữ liệu toàn cầu đang chuyển mình mạnh mẽ, với động lực lớn đến từ sự phát triển của trí tuệ nhân tạo (AI), chuyển đổi số và các yêu cầu về ESG.
Tại Mỹ, dự án Stargate của OpenAI trị giá 500 tỷ USD là biểu tượng của làn sóng đầu tư AI hạ tầng. Chính phủ Nhật và Anh cũng đang thúc đẩy sản xuất chip và mở rộng cơ sở hạ tầng AI nội địa.
Sức ép về tiêu thụ điện và làm mát khiến nhiều thị trường như Frankfurt, Ấn Độ hay Singapore buộc phải tái cấu trúc hạ tầng, tích hợp năng lượng tái tạo hoặc tăng cường công nghệ làm mát hiệu quả.
ESG không còn là chiến lược mà trở thành bắt buộc: Bắc Âu dùng thủy điện, Singapore công bố lộ trình trung tâm dữ liệu xanh với tiêu chí hiệu suất tái sử dụng năng lượng và làm mát tiên tiến.
Về đầu tư, năm 2024 chứng kiến sự phục hồi mạnh mẽ sau năm 2023 suy giảm do lãi suất: giao dịch bất động sản tăng 118%, đạt 24,5 tỷ bảng Anh, chủ yếu nhờ các thương vụ lớn như Blackstone mua AirTrunk trị giá 16 tỷ USD.
Vốn đầu tư M&A tăng 77% trong năm 2024, đạt 42,5 tỷ USD. Dự kiến năm 2025 đã có sẵn 32 tỷ USD chờ hoàn tất thương vụ.
Chi tiêu CapEx của các tập đoàn Big Tech (Microsoft, Amazon, Google, Meta) đạt 228 tỷ USD năm 2024 (+55%) và sẽ tăng lên 320 tỷ USD vào 2025, chủ yếu phục vụ hạ tầng AI.
Tỷ suất lợi nhuận (yield) của trung tâm dữ liệu tại thị trường cấp cao dao động từ 4,5%–5,5%, vẫn cao hơn bất động sản truyền thống, cho thấy sức hút mạnh mẽ từ nhà đầu tư tổ chức.
Các thị trường nổi bật:
- Ashburn, Virginia dẫn đầu toàn cầu về công suất, đang phát triển 15GW.
- Tokyo bị siết điện, mở rộng ra ngoại thành với sự hỗ trợ từ chính phủ.
- Singapore cực kỳ khan hiếm, giá thuê rack vượt 1.000 USD/kW.
- Dublin rơi vào khủng hoảng năng lượng, tạm dừng xét duyệt trung tâm dữ liệu mới đến 2028.
- Melbourne trỗi dậy nhờ được miễn hạn chế xuất GPU AI từ Mỹ.
- Paris và Milan là tâm điểm tăng trưởng mới tại châu Âu nhờ đầu tư khủng vào AI.
Tại khu vực APAC, các thị trường mới nổi như Johor (Malaysia), Mumbai (Ấn Độ), và Bangkok đang bùng nổ nhờ sự chuyển dịch khỏi các thị trường chính như Singapore.
Hoa Kỳ duy trì vị thế dẫn đầu về AI và trung tâm dữ liệu, tăng 46% công suất toàn cầu trong 2 năm tới và có thể đạt 177% tăng trưởng đến năm 2030.
Trung Quốc và châu Âu theo đuổi chiến lược khác nhau: Trung Quốc tập trung tốc độ và chi phí thấp, châu Âu chú trọng quy định đạo đức (EU AI Act).
Khung chính sách mới của Mỹ – AI Diffusion Framework – giới hạn quyền tiếp cận GPU AI cao cấp, ưu tiên các công ty nội địa, ảnh hưởng lớn đến thị trường quốc tế.

📌 Ngành trung tâm dữ liệu toàn cầu bước vào kỷ nguyên tăng trưởng chưa từng có với AI là động lực chính, dẫn đến đầu tư khổng lồ (320 tỷ USD Big Tech), phục hồi mạnh mẽ về giao dịch (+118%), và sự thay đổi chiến lược toàn cầu. Thách thức lớn nhất nằm ở nguồn điện và ESG, trong khi thị trường mới nổi đang bùng nổ với tốc độ triển khai chóng mặt.

https://content.knightfrank.com/research/2982/documents/en/data-centres-global-report-2025-12054.pdf

Phân tích chi tiết về trung tâm dữ liệu AI (DC AI)

Trung tâm dữ liệu AI (DC AI) đang là trụ cột chiến lược mới của hạ tầng số, thúc đẩy bởi nhu cầu tính toán khổng lồ của mô hình AI tạo sinh (GenAI), học sâu và inference thời gian thực.
Nhu cầu hạ tầng AI khiến dung lượng trung tâm dữ liệu tăng vọt. Năm 2024, chỉ riêng tại Mỹ, dung lượng AI-based DC đã tăng gấp đôi so với năm trước. Knight Frank dự báo tổng công suất trung tâm dữ liệu toàn cầu sẽ tăng 46% trong 2 năm tới và có thể tăng 177% đến năm 2030.
Hạ tầng AI đòi hỏi phần cứng chuyên biệt: GPU mạnh (Nvidia H100, B200), hệ thống mạng có độ trễ cực thấp (<20ms), và khả năng làm mát chất lỏng (liquid cooling) cho rack >80kW, thay vì 30-40kW như trước.
Chi phí đầu tư cực lớn: chi phí xây dựng trung tâm dữ liệu AI trung bình khoảng 15 triệu bảng Anh mỗi MW, chưa tính 10–15% chi phí cho đất và điện. Trong khi đó, chi phí vận hành cao do cần hệ thống điện dự phòng (redundancy) và giải nhiệt liên tục.
Mỹ hiện là quốc gia dẫn đầu tuyệt đối về DC AI:
- Sở hữu môi trường pháp lý “ưu tiên đổi mới” với chính sách AI Diffusion Framework (đầu 2025): giới hạn quyền truy cập GPU cao cấp chỉ dành cho công ty Mỹ hoặc chi nhánh do Mỹ kiểm soát.
- Tập trung vào sản xuất bán dẫn nội địa (CHIPS Act), mở rộng nhanh cơ sở hạ tầng AI tại các bang như Virginia, Ohio.
- Nvidia ghi nhận doanh thu GPU AI tăng gấp 3 lần trong năm 2024.
Trung Quốc nổi lên là đối thủ đáng gờm: mô hình DeepSeek đạt chất lượng tương đương GPT-4 với chi phí cực thấp, tạo áp lực cạnh tranh mới. Dù bị hạn chế xuất khẩu GPU từ Mỹ, các hãng TQ tập trung phát triển AI hiệu quả hơn về mặt chi phí.
Châu Âu lại đi theo hướng “kiểm soát đạo đức” với đạo luật EU AI Act – áp dụng cơ chế cấp phép và phân loại rủi ro với AI, khiến tốc độ triển khai hạ tầng chậm hơn Mỹ.
Các thị trường nổi bật về DC AI:
- Ashburn (Mỹ): trung tâm AI lớn nhất thế giới, có hơn 4,5GW công suất hoạt động, sắp mở rộng lên 15GW.
- Melbourne (Úc): hưởng lợi từ quyền truy cập chip Nvidia, thúc đẩy triển khai hạ tầng AI dày đặc, rack vượt 80kW, đầu tư mạnh từ hyperscaler.
- Johor (Malaysia): trở thành trung tâm AI nhờ triển khai nhanh (chỉ 12 tháng), thu hút cả ByteDance và Alibaba.
- Norway: 25,2% hoạt động cho AI và 4,3% cho HPC – vượt cả cloud, sử dụng năng lượng tái tạo.
- Dammam (Ả Rập Saudi): phát triển AI theo tầm nhìn Vision 2030, hợp tác Google Cloud và Dawiyat, dự kiến tạo hơn 71 tỷ USD tác động kinh tế.

📌 Trung tâm dữ liệu AI là “chiến trường mới” của thế giới số, với Mỹ dẫn đầu nhờ ưu thế công nghệ và chính sách, Trung Quốc tạo sức ép cạnh tranh chi phí, còn châu Âu thận trọng với luật đạo đức. DC AI yêu cầu đầu tư lớn (15 triệu bảng/MW), điện năng cao, và công nghệ làm mát tiên tiến – nhưng mang lại tiềm năng sinh lời khổng lồ và là xương sống của tương lai AI.

Phân tích chi tiết khu vực ASEAN về trung tâm dữ liệu

ASEAN đang chuyển mình thành khu vực trọng điểm trong chuỗi cung ứng hạ tầng số toàn cầu nhờ chi phí thấp, tốc độ triển khai nhanh, và chính sách thân thiện đầu tư. Khi các thị trường truyền thống như Singapore, Nhật, và Hàn Quốc đối mặt giới hạn đất đai và điện năng, nhà đầu tư đang đổ về Đông Nam Á.
Johor (Malaysia) là thị trường năng động nhất ASEAN hiện nay:
- Nổi lên như sự mở rộng tự nhiên của Singapore do giá đất và điện thấp hơn, lại gần về địa lý.
- Thu hút các tập đoàn như ByteDance, Alibaba, Sea Group với yêu cầu AI cao, nhờ khả năng triển khai nhanh – chỉ trong 12 tháng, so với 24–36 tháng ở nơi khác.
- Cơ chế phê duyệt linh hoạt, có chính sách hỗ trợ triển khai trung tâm dữ liệu quy mô lớn với chi phí tiết kiệm.
Bangkok (Thái Lan) chứng kiến làn sóng hyperscaler tự xây dựng (self-build) thay vì thuê colocation:
- AWS và Google đã mua nhiều khu đất lớn tại Chonburi để triển khai trung tâm dữ liệu quy mô gigawatt.
- Chính phủ Thái đang điều chỉnh khung pháp lý AI, nhưng việc bị xếp là thị trường Tier 2 trong AI Diffusion Framework của Mỹ gây khó khăn trong việc tiếp cận GPU cao cấp như H100, ảnh hưởng tới năng lực xử lý AI.
- Tuy nhiên, mô hình tự xây vẫn tiếp tục phát triển nhờ chi phí vận hành thấp và độ chủ động cao.
Việt Nam là thị trường đang nổi với tiềm năng dài hạn:
- Gặp thách thức về ổn định điện và thiếu khung quy chuẩn thống nhất toàn quốc, nhưng chi phí lao động, đất và vận hành thấp là lợi thế cạnh tranh lớn.
- Cần đầu tư vào nâng cấp hạ tầng truyền dẫn, hệ thống điện lưới và cơ chế phê duyệt cấp quốc gia để cạnh tranh với Malaysia và Thái Lan.
- Đang được các tập đoàn Hàn Quốc, Nhật Bản và Trung Quốc quan tâm – đặc biệt là trong mô hình edge DC và micro DC phục vụ thành phố thông minh, công nghiệp 4.0.
Indonesia và Philippines:
- Indonesia đang có nhiều dự án tại khu vực Jakarta và Batam nhưng hạ tầng điện chưa ổn định, khó thu hút hyperscaler AI.
- Philippines có tiềm năng về vị trí chiến lược gần biển, nhưng vấn đề giá điện cao và độ tin cậy điện thấp cản trở sự phát triển nhanh.
Singapore dù vẫn là trung tâm chính của ASEAN nhưng đang bị giới hạn:
- Sau lệnh tạm ngừng (moratorium) 2019–2022, chính phủ chỉ cấp phép các dự án đạt tiêu chuẩn năng lượng nghiêm ngặt.
- Giá thuê rack lên đến 1.000 USD/kW, khiến nhiều nhà đầu tư tìm đến Johor như một giải pháp thay thế.

📌 ASEAN đang trở thành tâm điểm mới cho trung tâm dữ liệu với Johor và Bangkok dẫn đầu nhờ chi phí thấp, tốc độ triển khai nhanh, và hỗ trợ từ chính phủ. Việt Nam có tiềm năng lớn nhưng cần cải thiện hạ tầng điện và khung pháp lý. Khi Singapore siết chặt quy định, ASEAN sẽ tiếp tục thu hút làn sóng hyperscaler toàn cầu trong cuộc đua hạ tầng AI.

Không có file đính kèm.

Nguồn tham khảo

133

Semi-Cloud-DC-Green AI chips-hardware-compute 2025-04-09 16:28:34

Anh quốc có nguy cơ mất vị thế về trung tâm dữ liệu vào tay Pháp do thiếu hụt năng lượng hạt nhân

- David Hogan, giám đốc bán hàng châu Âu của Nvidia, cảnh báo rằng nguồn cung cấp điện hiện là "yếu tố hạn chế lớn nhất" đối với các nhà phát triển AI khi họ nỗ lực phát triển phần mềm ngày càng tinh vi hơn.

- Anh quốc hiện có 9 lò phản ứng hạt nhân với tổng công suất khoảng 6 gigawatt, trong khi Pháp có 57 lò phản ứng với công suất 63 gigawatt. Hầu hết các nhà máy điện hạt nhân của Anh sẽ ngừng hoạt động vào cuối những năm 2020 đến đầu những năm 2030.

- Tổng thống Pháp Emmanuel Macron gần đây đã công bố các dự án trung tâm dữ liệu trị giá 109 tỷ euro (84 tỷ bảng Anh), tất cả đều được xây dựng xung quanh các cơ sở hạt nhân.

- Hogan nhấn mạnh rằng các quốc gia đầu tư vào năng lượng hạt nhân như Pháp đang ở vị thế tốt hơn nhiều so với các nước khác trong cuộc đua phát triển khả năng "chủ quyền" về AI.

- Yêu cầu điện năng điển hình cho một trung tâm dữ liệu ở châu Âu đã tăng từ 5 megawatt lên 50 megawatt chỉ trong vài năm. Hogan cho biết: "Nếu bạn đang xem xét một trung tâm dữ liệu AI dưới 50 megawatt trong năm nay, có lẽ bạn không nghiêm túc."

- Hầu hết các dự án hiện tại liên quan đến Nvidia có quy mô từ 500 megawatt đến 1 gigawatt - tương đương với công suất của một nhà máy điện lớn hoặc đủ để cung cấp điện cho khoảng 1 triệu hộ gia đình.

- Thủ tướng Anh Keir Starmer đã cam kết tạo ra "các khu vực tăng trưởng AI" nơi các công ty có thể nhanh chóng nhận được giấy phép quy hoạch và kết nối với lưới điện. Ông cũng đề cập đến khả năng sử dụng lò phản ứng mô-đun nhỏ (SMR) để cung cấp năng lượng cho các trung tâm dữ liệu.

- Bộ trưởng năng lượng hạt nhân Lord Hunt cho biết chính phủ Anh nhận thấy lợi ích của các trung tâm dữ liệu AI được cung cấp năng lượng bằng hạt nhân tiên tiến và đang nỗ lực tìm cách khai thác tiềm năng này.

- Các gã khổng lồ công nghệ như Microsoft, Amazon và Google đã chuyển sang sử dụng năng lượng hạt nhân ở Mỹ để đáp ứng nhu cầu điện ngày càng tăng cho hoạt động AI của họ.

- Edward Galvin, chuyên gia về trung tâm dữ liệu tại công ty tư vấn DC Byte, lưu ý rằng các nhà máy điện hạt nhân mới khó có thể sẵn sàng kịp thời cho nhiều dự án phát triển trong những năm tới. Ông cho rằng nhiều công ty công nghệ sẽ sử dụng tua-bin làm mát bằng khí đốt trong ngắn hạn và trung hạn.

📌 Anh quốc đang tụt hậu so với Pháp trong cuộc đua xây dựng trung tâm dữ liệu AI do năng lực điện hạt nhân thấp hơn (6GW so với 63GW). Các trung tâm dữ liệu AI hiện đại yêu cầu ít nhất 50MW điện, với nhiều dự án lên đến 1GW, đủ cung cấp cho 1 triệu hộ gia đình.

https://finance.yahoo.com/news/britain-risks-losing-france-data-171535082.html

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-04-09 10:51:40

Nhật Bản đầu tư hàng tỷ USD vào hạ tầng AI với trung tâm dữ liệu lớn nhất châu Á

- SoftBank đang xây dựng một trong những trung tâm dữ liệu AI lớn nhất tại Osaka, trên khu đất rộng khoảng 440.000 mét vuông của nhà máy Sakai cũ của Sharp. Dự án này có công suất ban đầu hơn 150 megawatt và có thể mở rộng lên hơn 400 megawatt. Với tổng diện tích sàn 750.000 mét vuông, cơ sở này dự kiến trở thành một trong những dự án cơ sở hạ tầng AI cốt lõi của Nhật Bản, phục vụ cả phát triển AI của SoftBank và các tổ chức bên ngoài như trường đại học và trung tâm nghiên cứu.

- KDDI Corporation đã hợp tác với Sharp, Supermicro và Datasection để phát triển trung tâm dữ liệu AI thế hệ tiếp theo tại cùng nhà máy Sakai. Cơ sở này sẽ triển khai hệ thống GB200 NVL72 của NVIDIA, được thiết kế để xử lý nhu cầu điện toán cực cao của việc đào tạo mô hình AI. Kế hoạch của KDDI bao gồm công nghệ làm mát bằng nước tiên tiến và tối ưu hóa hoạt động để quản lý khối lượng công việc tiêu thụ nhiều năng lượng của các ứng dụng AI.

- Microsoft đã cam kết gần 3 tỷ USD để mở rộng cơ sở hạ tầng AI tại Nhật Bản đến năm 2025. Khoản đầu tư này bao gồm nâng cấp 2 trung tâm dữ liệu hiện có với bán dẫn AI tiên tiến và khởi động chương trình đào tạo AI cho 3 triệu lao động Nhật Bản. Microsoft cũng có kế hoạch mở phòng thí nghiệm nghiên cứu AI và robot tại Tokyo, củng cố cam kết dài hạn đối với hệ sinh thái AI của Nhật Bản.

- Từ tháng 10 năm 2023, SoftBank đã vận hành nền tảng điện toán AI tạo sinh được xây dựng dựa trên NVIDIA DGX SuperPOD. Hệ thống này bao gồm hơn 2.000 GPU NVIDIA Tensor Core và được thiết kế để hỗ trợ việc tạo ra các mô hình ngôn ngữ lớn (LLM) phù hợp với tiếng Nhật. Nền tảng này đánh dấu một trong những nỗ lực quy mô lớn đầu tiên để xây dựng các mô hình AI tạo sinh được tối ưu hóa đặc biệt cho ngôn ngữ và văn hóa Nhật Bản.

- Cơ sở hạ tầng AI của Nhật Bản là một ưu tiên quốc gia với sự hỗ trợ mạnh mẽ từ các công ty công nghệ và quan hệ đối tác với các tên tuổi toàn cầu như NVIDIA, Microsoft và OpenAI. Bộ Kinh tế, Thương mại và Công nghiệp Nhật Bản (METI) đã xác định cơ sở hạ tầng AI là động lực cốt lõi của chuyển đổi số. Chính phủ cũng đang thúc đẩy quan hệ đối tác công-tư để tăng năng lực GPU, giải quyết các hạn chế về nguồn cung chip và khuyến khích thực hành điện toán xanh.

📌 Nhật Bản đang đầu tư mạnh mẽ vào hạ tầng AI với các dự án trung tâm dữ liệu khổng lồ từ SoftBank và KDDI, cùng khoản đầu tư 2,9 tỷ USD từ Microsoft. Quốc gia này đang xây dựng nền tảng số để phát triển mô hình ngôn ngữ tiếng Nhật và định vị mình như một cường quốc AI khu vực.

https://www.rcrwireless.com/20250408/fundamentals/5-ai-infra-japan

Không có file đính kèm.

Nguồn tham khảo

141

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-04-09 01:04:11

Làm mát bằng chất lỏng đang trở thành chất xúc tác cho AI bền vững trong các trung tâm dữ liệu

- Gartner dự báo chi tiêu toàn cầu cho phần mềm AI sẽ tăng trưởng với tốc độ 19,1% trong 6 năm tới, trong khi Tổng thống Trump đã công bố khoản đầu tư 500 tỷ USD vào cơ sở hạ tầng AI thông qua dự án Stargate.

- Theo khảo sát từ CFO, 94% giám đốc điều hành cảm thấy bắt buộc phải ưu tiên các sáng kiến về môi trường, xã hội và quản trị (ESG), đặt ra thách thức cho ngành công nghệ trong việc đáp ứng nhu cầu AI ngày càng tăng mà vẫn tuân thủ các tiêu chuẩn bền vững.

- McKinsey dự đoán công suất trung tâm dữ liệu toàn cầu có thể tăng hàng năm từ 19%-22% đến năm 2030, đạt từ 171 đến 219 gigawatt, khiến các cơ sở này trở thành xương sống cho sự phát triển của AI.

- Tải công việc AI tiêu thụ năng lượng cao đáng kể - một truy vấn ChatGPT tiêu thụ 2,9 watt-giờ điện, cao hơn nhiều so với 0,3 watt-giờ của một tìm kiếm Google.

- Làm mát bằng chất lỏng, đặc biệt là nước (dày đặc hơn không khí khoảng 800 lần), cung cấp giải pháp hiệu quả hơn để tản nhiệt so với hệ thống làm mát bằng không khí truyền thống, đặc biệt khi các giá đỡ máy chủ ngày càng dày đặc.

- Các phương pháp tốt nhất trong làm mát bằng chất lỏng bao gồm: ưu tiên quản lý nước (sử dụng nước tái chế và tối ưu hóa việc sử dụng), tập trung vào tính mô-đun (cho phép mở rộng hiệu quả) và thiết kế hướng tới tương lai (đáp ứng nhu cầu nhiệt ngày càng tăng của việc đào tạo AI).

- Tính bền vững trong trung tâm dữ liệu bắt đầu từ giai đoạn xây dựng, bao gồm loại bỏ sự phụ thuộc vào nhiên liệu hóa thạch và tích hợp hệ thống tái sử dụng năng lượng như mạng lưới sưởi ấm khu vực.

- Bản thân AI cũng có thể đóng vai trò nâng cao hiệu quả thông qua các thuật toán thông minh tối ưu hóa phân bổ tài nguyên và dự đoán nhu cầu làm mát, tạo ra mối quan hệ cộng sinh giữa AI và giảm thiểu tác động môi trường.

- Trong ngắn hạn, cân bằng việc sử dụng nước và áp dụng các phương pháp làm mát có trách nhiệm là rất quan trọng; trong dài hạn, những tiến bộ trong công nghệ làm mát sẽ thúc đẩy hiệu quả lớn hơn.

- Bằng cách ưu tiên cơ sở hạ tầng bền vững, ngành công nghiệp có thể mở đường cho tương lai nơi tiến bộ công nghệ và quản lý môi trường đi đôi với nhau.

📌 Làm mát bằng chất lỏng đang trở thành giải pháp thiết yếu cho trung tâm dữ liệu AI bền vững, với khả năng tản nhiệt hiệu quả hơn 800 lần so với không khí. Đến 2030, công suất trung tâm dữ liệu toàn cầu dự kiến tăng 19-22% hàng năm, đạt 219 gigawatt, đòi hỏi cân bằng giữa hiệu suất AI và cam kết môi trường.

https://www.forbes.com/councils/forbestechcouncil/2025/04/07/liquid-cooling-a-catalyst-for-sustainable-ai-in-data-centers/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-04-08 23:53:17

IBM ra mắt IBM z17, máy tính mainframe mới nhất được thiết kế cho kỷ nguyên AI

- IBM vừa công bố IBM z17, phiên bản mới nhất của phần cứng máy tính mainframe, được trang bị bộ xử lý IBM Telum II và được mã hóa hoàn toàn.
- Mainframe mới được thiết kế cho hơn 250 trường hợp sử dụng AI, bao gồm AI agent và AI tạo sinh.
- Mặc dù mainframe có vẻ lỗi thời, nhưng 71% công ty trong danh sách Fortune 500 vẫn đang sử dụng chúng. Thị trường mainframe năm 2024 được ước tính trị giá 5,3 tỷ USD theo công ty tư vấn Market Research Future.
- IBM z17 có thể xử lý 450 tỷ phép tính suy luận trong một ngày, tăng 50% so với người tiền nhiệm IBM z16 được ra mắt năm 2022.
- Hệ thống được thiết kế để tích hợp hoàn toàn với các phần cứng, phần mềm và công cụ nguồn mở khác.
- Tina Tarquinio, Phó chủ tịch quản lý sản phẩm và thiết kế của IBM Z, cho biết bản nâng cấp mainframe này đã được phát triển trong 5 năm - trước cả cơn sốt AI hiện tại bắt đầu từ việc OpenAI ra mắt ChatGPT vào tháng 11/2022.
- IBM đã dành hơn 2.000 giờ nghiên cứu để thu thập phản hồi từ hơn 100 khách hàng khi xây dựng z17.
- Tarquinio cho biết thật thú vị khi thấy phản hồi họ nhận được 5 năm trước phù hợp với hướng đi của thị trường hiện tại.
- IBM z17 được thiết kế để thích ứng với sự phát triển của thị trường AI. Mainframe sẽ hỗ trợ 48 chip tăng tốc AI IBM Spyre khi ra mắt, và dự kiến nâng lên 96 chip trong vòng 12 tháng.
- Một trong những điểm nổi bật của phần cứng mới này là z17 tiết kiệm năng lượng hơn so với phiên bản trước và cả đối thủ cạnh tranh.
- Trên chip, IBM tăng khả năng tăng tốc AI lên 7,5 lần, nhưng tiêu thụ ít hơn 5,5 lần năng lượng so với việc thực hiện các mô hình đa dạng trên các nền tảng tăng tốc khác trong ngành.
- Mainframe z17 sẽ được bán rộng rãi vào ngày 8 tháng 6.

📌 IBM z17 đánh dấu bước tiến lớn trong công nghệ mainframe với khả năng xử lý 450 tỷ phép tính suy luận/ngày, tăng 50% so với z16. Được phát triển trong 5 năm với hơn 2.000 giờ nghiên cứu, mainframe mới hỗ trợ 48 chip AI Spyre, tiết kiệm năng lượng và sẽ ra mắt vào 8/6.

https://techcrunch.com/2025/04/07/ibm-releases-a-new-mainframe-built-for-the-age-of-ai/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-04-07 05:39:10

Chip 2nm mới nhất của Đài Loan sẽ củng cố "lá chắn silicon" chống lại nguy cơ tấn công từ Trung Quốc

- Ngày 1/4/2025, nhà sản xuất Đài Loan TSMC đã giới thiệu chip vi mạch tiên tiến nhất thế giới: chip 2-nanometer (2nm).
- Sản xuất hàng loạt dự kiến bắt đầu vào nửa cuối năm 2025, với lời hứa mang lại bước tiến lớn về hiệu suất và hiệu quả.
- So với chip tiên tiến trước đó (3nm), công nghệ 2nm của TSMC cung cấp tăng 10%-15% tốc độ tính toán ở cùng mức năng lượng hoặc giảm 20%-30% mức tiêu thụ điện ở cùng tốc độ.
- Mật độ transistor trong chip 2nm tăng khoảng 15% so với công nghệ 3nm, cho phép thiết bị hoạt động nhanh hơn, tiêu thụ ít năng lượng hơn và xử lý hiệu quả các tác vụ phức tạp.
- Ngành công nghiệp vi mạch của Đài Loan gắn liền với an ninh quốc gia, đôi khi được gọi là "lá chắn silicon", vì tầm quan trọng kinh tế rộng lớn khuyến khích Mỹ và đồng minh bảo vệ Đài Loan trước khả năng Trung Quốc tấn công.
- TSMC gần đây đã ký thỏa thuận trị giá 100 tỷ USD để xây dựng năm nhà máy mới tại Mỹ, tuy nhiên vẫn còn bất ổn liệu chip 2nm có thể được sản xuất bên ngoài Đài Loan hay không.
- Thành lập năm 1987, TSMC sản xuất chip cho các công ty khác, chiếm 60% thị trường "foundry" toàn cầu (gia công bán dẫn).
- TSMC sản xuất bộ xử lý A-series của Apple, GPU của NVidia dùng cho AI và machine learning, bộ xử lý Ryzen và EPYC của AMD, và bộ xử lý Snapdragon của Qualcomm.
- Năm 2020, TSMC bắt đầu quy trình thu nhỏ vi mạch đặc biệt gọi là công nghệ 5nm FinFET, đóng vai trò quan trọng trong phát triển điện thoại thông minh và điện toán hiệu năng cao (HPC).
- Hai năm sau, TSMC ra mắt quy trình thu nhỏ 3nm dựa trên chip vi mạch nhỏ hơn, nâng cao hiệu suất và hiệu quả năng lượng.
- Điện thoại thông minh, laptop và máy tính bảng với chip 2nm có thể hưởng lợi từ hiệu suất tốt hơn và thời lượng pin dài hơn, dẫn đến thiết bị nhỏ hơn, nhẹ hơn mà không giảm sức mạnh.
- Hiệu quả và tốc độ của chip 2nm có tiềm năng nâng cao các ứng dụng dựa trên AI như trợ lý giọng nói, dịch ngôn ngữ thời gian thực và hệ thống máy tính tự chủ.
- Trung tâm dữ liệu có thể giảm tiêu thụ năng lượng và cải thiện khả năng xử lý, góp phần vào mục tiêu bền vững môi trường.
- Các lĩnh vực như xe tự lái và robot có thể hưởng lợi từ tốc độ xử lý và độ tin cậy cao hơn của chip mới.
- Sản xuất chip 2nm đòi hỏi kỹ thuật tiên tiến như quang khắc cực tím (EUV), một quy trình phức tạp và đắt đỏ.
- Quản lý tản nhiệt trở thành thách thức quan trọng khi transistor thu nhỏ và mật độ tăng lên, ảnh hưởng đến hiệu suất và độ bền của chip.

📌 Chip 2nm của TSMC sẽ tạo bước ngoặt công nghệ với tăng 15% mật độ transistor, tăng 15% tốc độ và giảm 30% năng lượng. Vừa củng cố vị thế "lá chắn silicon" của Đài Loan vừa mở ra kỷ nguyên mới cho AI, điện toán hiệu năng cao và thiết bị thông minh tiết kiệm năng lượng.

https://asiatimes.com/2025/04/taiwans-new-2nm-chip-set-to-power-the-ai-revolution/#

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-04-06 16:16:30

Huawei đột phá với công nghệ logic tam phân, thách thức lệnh cấm Mỹ trong cuộc đua chip AI

- Huawei đang nỗ lực hàng ngày để cải thiện khả năng sản xuất chip AI và đã tìm ra giải pháp mới cho vấn đề tiêu thụ năng lượng của bộ xử lý AI.

- Công ty công nghệ Trung Quốc đang phải đối mặt với thiếu hụt công cụ sản xuất chip tiên tiến sau lệnh cấm của Mỹ. Mặc dù đã phục hồi được chip Kirin 5G trong các thiết bị, quá trình sản xuất chip vẫn gặp khó khăn và cần cải thiện nhiều.

- Huawei cùng các đối tác bán dẫn đã bắt đầu tìm ra các phương pháp để cải thiện và tiến bộ trong sản xuất chip AI.

- Công ty đã đăng ký bằng sáng chế công nghệ "logic tam phân" mới để làm cho bộ xử lý AI tiết kiệm năng lượng hơn. Công nghệ này sử dụng hệ thống số -1, 0 và 1 thay vì mã nhị phân đang thống trị thị trường.

- Công nghệ mới có thể giảm số lượng bóng bán dẫn áp dụng cho bộ xử lý AI. Bộ xử lý với ít bóng bán dẫn và kích thước nhỏ hơn có thể tiết kiệm năng lượng hơn vì chúng có điện dung thấp hơn và cần ít năng lượng hơn để thay đổi trạng thái.

- Điều này sẽ giảm tiêu thụ điện năng, làm cho chúng hiệu quả hơn cho trung tâm dữ liệu và các ứng dụng AI khác, đồng thời có thể tăng sản lượng chip AI.

- Mặt khác, Huawei đang thử nghiệm máy sản xuất chip EUV do Trung Quốc sản xuất. Máy này được cấp bằng sáng chế vào năm 2023 và gần đây đã được phê duyệt cho thử nghiệm thương mại.

- Máy EUV mới dựa trên công nghệ LDP (Plasma cảm ứng phóng điện laser) với thiết kế đơn giản và nhỏ gọn hơn so với thiết bị chip ASML dựa trên LPP, giúp giảm tiêu thụ năng lượng và tiết kiệm chi phí.

📌 Huawei đang vượt qua lệnh cấm của Mỹ bằng cách phát triển công nghệ logic tam phân cho chip AI tiết kiệm năng lượng và thử nghiệm máy EUV sản xuất tại Trung Quốc, đánh dấu bước tiến quan trọng trong nỗ lực tự chủ công nghệ bán dẫn.

https://www.huaweicentral.com/huawei-is-making-more-progress-in-ai-chip-manufacturing/

Không có file đính kèm.

Nguồn tham khảo

129

AI chips-hardware-compute AI pháp lý-quản trị-chủ quyền 2025-04-06 05:46:57

Ngành công nghiệp AI đang hoang mang trước tác động của thuế quan Trump đối với nguồn cung GPU

- Các công ty AI không thể xác định liệu GPU (đơn vị xử lý đồ họa) có được miễn thuế quan Trump hay không, gây ra tình trạng hoang mang trong toàn ngành.

- Thị trường chứng khoán rơi vào hỗn loạn với Nvidia giảm 7,59% và TSMC giảm 7,22% giá trị cổ phiếu.

- Tại San Francisco, nhiều nguồn tin cho rằng đây không phải vấn đề lớn, trong khi tại Washington DC, mọi người đang hoảng loạn về tình hình.

- Chính quyền Trump đã nêu rõ ngoại lệ cho các chip bán dẫn cốt lõi trong GPU, nhưng các sản phẩm điện tử hoàn chỉnh chứa chip vẫn phải chịu thuế quan.

- Giáo sư Chris Miller từ Đại học Tufts cho biết hầu hết GPU phục vụ AI được nhập khẩu dưới dạng máy chủ từ Đài Loan, do đó sẽ phải chịu mức thuế quan 32% dự kiến có hiệu lực vào ngày 9/4.

- Các cơ quan chính phủ không cung cấp được câu trả lời rõ ràng về tình hình, với NIST chuyển câu hỏi đến Nhà Trắng, trong khi Nhà Trắng và Đại diện Thương mại Hoa Kỳ chưa phản hồi.

- Các nhà vận động hành lang công nghệ tại Washington lo ngại về bản chất thất thường và mang tính trả đũa của tổng thống đối với ngành công nghệ.

- Sự mơ hồ về thuế quan GPU đang ảnh hưởng đến các công ty công nghệ lớn như Amazon, Google và Microsoft, vốn sở hữu hàng nghìn thiết bị này trong các trung tâm dữ liệu.

- Nhóm "Magnificent Seven" (7 công ty công nghệ hàng đầu) đã mất hơn 1.000 tỷ USD vốn hóa thị trường kể từ khi thuế quan được công bố.

- Nvidia đã bắt đầu chuyển sản xuất sang Mỹ, với kế hoạch sản xuất chip GPU Blackwell AI tại nhà máy TSMC ở Arizona.

- CEO Nvidia Jensen Huang tuyên bố công ty có thể điều chỉnh sản xuất tại nhiều địa điểm khác nhau, giảm thiểu tác động của thuế quan.

- Các phòng thí nghiệm AI, nhà cung cấp đám mây và người dùng PC có thể phải trả nhiều tiền hơn cho GPU nếu thuế quan được áp dụng.

- Trung Quốc đã công bố một loạt hạn chế xuất khẩu mới đối với khoáng sản đất hiếm, vốn rất quan trọng cho sản xuất điện tử, trong khi Mỹ hiện nhập khẩu 90% khoáng sản đất hiếm từ Trung Quốc.

- Một nhóm CEO công nghệ và lãnh đạo tài chính đang trên đường đến khu nghỉ dưỡng riêng Mar-a-Lago của Trump, nhằm tìm hiểu rõ hơn về thuế quan và có thể xin miễn trừ.

📌 Thuế quan mới của Trump đã gây hoang mang cho ngành AI với mức thuế 32% có thể áp dụng cho GPU nhập từ Đài Loan. Nvidia và các công ty công nghệ lớn đã mất hơn 1.000 tỷ USD vốn hóa, buộc họ phải chuyển sản xuất về Mỹ hoặc tìm cách được miễn thuế thông qua quan hệ với chính quyền.

https://www.theverge.com/tech/643753/gpu-tariffs-nvidia-tsmc-chips-openai

Ngành công nghiệp AI không biết liệu Trump vừa kết liễu nguồn cung GPU của họ

Sự không chắc chắn về thuế quan đã khiến ngành công nghệ mất hơn 1 nghìn tỷ USD vốn hóa thị trường.

Tác giả: Tina Nguyen và Kylie Robison

Các công ty AI không thể xác định liệu thuế quan của Trump có sắp tàn phá họ hay không – và thực tế là không ai có câu trả lời rõ ràng đang khiến họ, và toàn bộ ngành công nghệ, rơi vào một vòng xoáy hoang mang.

Thị trường đang trong tình trạng hỗn loạn. Nvidia giảm 7,59%, TSMC giảm 7,22%. Tại San Francisco, các nguồn tin cho chúng tôi biết rằng đây không phải là vấn đề lớn. Nhưng tại DC, mọi người đang hoảng loạn. Câu hỏi cốt lõi là liệu GPU – các đơn vị xử lý đồ họa quan trọng đối với điện toán AI và các ngành công nghiệp khác – có được miễn trừ khỏi thuế quan toàn diện của Donald Trump hay không, và câu trả lời đáng ngạc nhiên là rất mơ hồ.

Trong các phòng thí nghiệm AI, các nhà nghiên cứu kỳ vọng rằng ngành công nghiệp của họ sẽ được miễn thuế quan. "Tôi hoàn toàn mong đợi đây sẽ là tình huống Trump lại một lần nữa cho các công ty mà ông ta xem là quan trọng/đứng về phía ông ta/bất cứ điều gì một sự ưu đãi," tương tự như những gì Tổng thống đã làm với Apple trong nhiệm kỳ đầu tiên của ông, một nguồn tin từ một phòng thí nghiệm AI lớn nói với The Verge.

Tuy nhiên, tại Washington, dường như không ai chắc chắn về tình hình hiện tại. Chính quyền Trump đã nêu rõ một ngoại lệ cho các chip bán dẫn ở trung tâm của GPU, nhưng hiện tại, các sản phẩm điện tử hoàn chỉnh có chứa chip dường như sẽ phải chịu thuế quan. Và các công ty cần GPU cho machine learning, deep learning, xử lý thời gian thực, và nhiều hơn nữa không chỉ cần chip, mà còn cần toàn bộ máy được xây dựng xung quanh nó. "Hầu hết GPU AI, tôi tin rằng, được nhập khẩu không phải dưới dạng chip mà là máy chủ, chủ yếu từ Đài Loan," Chris Miller, giáo sư tại Đại học Tufts và tác giả của Chip War: The Fight for the World's Most Critical Technology, nói với The Verge qua email. "Vì vậy, những thiết bị này có thể sẽ phải chịu mức thuế quan chung của Đài Loan" là 32%, hiện đang được lên lịch áp dụng vào ngày 9 tháng 4.

Thông thường, các cơ quan chính phủ có thể giải thích những gì đang xảy ra. Nhưng khi được yêu cầu làm rõ, một quan chức phụ trách công tác đối ngoại tại NIST, cơ quan của Bộ Thương mại giám sát Đạo luật CHIPS – khoản đầu tư 50 tỷ USD vào việc xây dựng các nhà máy sản xuất chip trên đất Mỹ – đã chuyển The Verge đến Nhà Trắng. Nhà Trắng không ngay lập tức trả lời yêu cầu bình luận. Đại diện Thương mại Hoa Kỳ, cơ quan chịu trách nhiệm tạo ra và thực hiện chiến lược thuế quan của Tổng thống, cũng không phản hồi.

Trong khi đám đông ở SF lạc quan về việc được miễn trừ, các nhà vận động hành lang công nghệ tại Washington gần gũi hơn với tình trạng hỗn loạn của chính quyền Trump thứ hai, và quá quen thuộc với những thay đổi thất thường và bản chất trả thù của tổng thống, đặc biệt là đối với ngành công nghệ. Thực tế là các thuế quan quá mơ hồ và dường như được đưa ra một cách bất cẩn – thực sự quá bất cẩn đến mức có một lập luận chính đáng rằng chúng được tạo ra bởi AI – chỉ làm tăng thêm lo lắng của họ. "Mọi người đều đang yêu cầu sự rõ ràng" từ chính quyền, một nhà vận động hành lang tại một công ty công nghệ lớn nói với The Verge. "Cho đến nay, mọi người đang nói rằng họ nghĩ chúng tôi ổn, nhưng chưa chắc chắn." Đó không hẳn là một sự bỏ phiếu tin tưởng mạnh mẽ cho việc miễn thuế quan GPU.

Sự hoang mang về GPU đang lan rộng ra ngoài ngành công nghiệp AI, tác động đến các công ty Công nghệ Lớn có hàng nghìn thiết bị này trong các trung tâm dữ liệu trên khắp đất nước. Amazon, Google và Microsoft đều phụ thuộc vào việc tiếp cận GPU để hỗ trợ kiến trúc đám mây trị giá hàng tỷ đô la của họ. Rõ ràng, thị trường không tự tin rằng doanh thu của họ sẽ vượt qua được những thuế quan này: Cái gọi là "Magnificent Seven", bao gồm ba công ty trên, đã mất hơn 1 nghìn tỷ USD vốn hóa thị trường kể từ khi thuế quan được công bố. (Người phát ngôn của Google và Microsoft từ chối bình luận cho bài viết này.)

Ngành công nghiệp AI có lý do để nghĩ rằng Trump có thể ưu ái họ đặc biệt. Chỉ vài tháng trước, Sam Altman của OpenAI và các CEO công nghệ khác đã đứng tại Nhà Trắng bên cạnh tổng thống để công bố Stargate, một dự án cơ sở hạ tầng trung tâm dữ liệu trị giá 500 tỷ USD dành riêng để đáp ứng yêu cầu của Altman về "thêm khả năng tính toán." Tuy nhiên, tình trạng không rõ ràng hiện tại của GPU cùng với tính không thể dự đoán của thuế quan của Trump nói chung, có thể làm lung lay niềm tin của họ — hoặc ít nhất có nghĩa là họ phải nỗ lực mới để được Trump ưu ái.

Đại gia GPU Nvidia đã bắt đầu chuyển sản xuất sang Hoa Kỳ

Đại gia GPU Nvidia dường như đã bắt đầu chuyển sản xuất sang Hoa Kỳ, điều mà họ hy vọng sẽ giúp bảo vệ họ khỏi thuế quan. Reuters đã đưa tin vào tháng 12 năm ngoái, chẳng hạn, rằng họ đang hoàn tất kế hoạch sản xuất chip GPU AI Blackwell của mình tại nhà máy Arizona của TSMC, dự kiến bắt đầu sản xuất chip vào năm nay. CEO Nvidia Jensen Huang đã ám chỉ đến sự hợp tác này trong một phiên hỏi đáp nhà đầu tư gần đây: "Chúng tôi đang sản xuất ở rất nhiều nơi khác nhau. Chúng tôi có thể dịch chuyển mọi thứ xung quanh. Thuế quan sẽ có tác động nhỏ đối với chúng tôi trong ngắn hạn. Dài hạn, chúng tôi sẽ có sản xuất trong nước."

Điều tương tự không thể nói về các phòng thí nghiệm AI đòi hỏi nhiều khả năng tính toán, các nhà cung cấp đám mây quy mô lớn, hoặc thậm chí những người lắp ráp PC thông thường — tất cả những người có thể sẽ phải trả nhiều hơn đáng kể cho GPU. "Không có gì là không thể, nhưng cố gắng sản xuất mọi phân khúc của chuỗi cung ứng điện tử trong nước sẽ tạo ra sự gia tăng chi phí đáng kinh ngạc, đặc biệt là trong ngắn hạn, vì một số khả năng đơn giản là không tồn tại trong nước," Miller nói. Điều đó thậm chí không tính đến thuế quan đối với nguyên liệu thô cần thiết để xây dựng các máy móc và nhà máy này, hoặc bất kỳ biện pháp trả đũa nào: vào thứ Sáu, chẳng hạn, Trung Quốc đã công bố một bộ hạn chế xuất khẩu mới đối với khoáng chất đất hiếm, thứ rất quan trọng cho sản xuất điện tử. Hoa Kỳ hiện nhập khẩu 90% khoáng chất đất hiếm từ Trung Quốc.

"Nếu thuế quan không thay đổi," Miller nói thêm, "chúng ta nên chuẩn bị cho sự gia tăng đáng kể trong giá thiết bị điện tử."

Nhưng cuối cùng, lòng trung thành với Trump có thể quan trọng hơn một lời kêu gọi lý trí. Người sáng lập Amazon Jeff Bezos đã thề trung thành với chính quyền mới, điều quan trọng đối với Anthropic, vì họ lấy một số khả năng tính toán thông qua Amazon. Tuy nhiên, những thỏa thuận này rất mong manh. Một câu chuyện phê bình duy nhất trên tờ báo The Washington Post của Bezos có thể khiến Amazon (và Anthropic liên quan) mất miễn trừ thuế quan, chẳng hạn. Anthropic cũng lấy một số khả năng tính toán thông qua Google; cùng với Bezos, CEO Alphabet Sundar Pichai đã tham gia vào nhóm các tỷ phú công nghệ đứng sau Trump trong lễ nhậm chức của ông.

Và tất nhiên, có những yếu tố khác có thể gián tiếp gây ra vấn đề cho các công ty này — như việc Hoa Kỳ bị đẩy vào suy thoái kinh tế làm tàn phá nền kinh tế công nghệ. "Các hiệu ứng bậc hai của thuế quan vẫn có thể tồi tệ," nguồn tin từ phòng thí nghiệm AI nói thêm.

Sự sụt giảm của thị trường dường như đã huy động các nhà lãnh đạo công nghệ. Một nhóm các CEO công nghệ và lãnh đạo tài chính đang trên đường đến khu nghỉ dưỡng riêng của Trump, Mar-a-Lago, theo nhà báo Kara Swisher. Mục tiêu dường như là để tìm kiếm một số ý nghĩa trong những thuế quan này — và có lẽ là một số miễn trừ.

Không có file đính kèm.

Nguồn tham khảo

101

AI chips-hardware-compute 2025-04-06 04:44:28

Loongson tung chip AI mới: Bước tiến lớn của Trung Quốc trong cuộc đua công nghệ với phương Tây

- Loongson Technology vừa ra mắt thế hệ chip mới 2K3000 và 3B6000M, đánh dấu bước tiến vào "kỷ nguyên bộ xử lý AI".

- Hai chip mới có cùng cấu trúc silicon nhưng khác nhau về đóng gói, một cho ứng dụng điều khiển công nghiệp và một cho thiết bị di động.

- Chip tích hợp 8 lõi CPU dựa trên kiến trúc tập lệnh LoongArch do Loongson tự phát triển.

- GPU tích hợp cũng do Loongson tự phát triển, cung cấp khả năng tính toán đa năng và tăng tốc AI, được cho là cải thiện "gấp nhiều lần" so với thế hệ trước.

- Loongson tuyên bố đây là "bước nhảy vọt mới hướng tới xây dựng hệ sinh thái công nghệ thông tin tự chủ".

- Hệ sinh thái phần mềm hỗ trợ chip mới đang được hoàn thiện. Nhiều nhà sản xuất đã bắt đầu tích hợp chip vào thiết kế sản phẩm.

- Tháng 2/2025, Loongson thông báo đang phát triển CPU 3B6600 8 lõi cho máy tính để bàn, có thể so sánh với dòng Intel Core thế hệ 12-13.

- Loongson được thành lập năm 2001, tách ra từ Viện Khoa học Trung Quốc năm 2010 để thương mại hóa nghiên cứu chip.

- Công ty tập trung vào thị trường CPU, lĩnh vực lâu nay do Intel và AMD thống trị. Tháng 3/2023, Loongson bị Mỹ đưa vào danh sách đen thương mại.

- Loongson hoạt động theo mô hình fabless, phát triển chip và giải pháp phần mềm/phần cứng liên quan, thuê ngoài sản xuất.

- Năm 2024, doanh thu Loongson đạt 506,89 triệu nhân dân tệ (69,7 triệu USD), tăng 0,24% so với năm trước. Lỗ ròng tăng lên 623,76 triệu nhân dân tệ.

📌 Loongson Technology ra mắt chip AI mới tích hợp CPU và GPU tự phát triển, đánh dấu bước tiến quan trọng trong nỗ lực tự chủ công nghệ của Trung Quốc. Mặc dù doanh thu chỉ tăng nhẹ 0,24% năm 2024, công ty vẫn được định giá 52,03 tỷ nhân dân tệ trên thị trường chứng khoán.

https://www.scmp.com/tech/big-tech/article/3305100/tech-war-china-claims-ai-chip-progress-loongson-unveils-cpus-amid-self-sufficiency-push

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-04-04 09:23:35

Trung Quốc đổ hàng tỷ đô vào hạ tầng AI nhưng 80% trung tâm dữ liệu đang bỏ không

- Trung quốc đã xây dựng hơn 500 dự án trung tâm dữ liệu mới trong năm 2023-2024, với ít nhất 150 trung tâm đã hoàn thành vào cuối năm 2024, nhưng theo báo cáo địa phương, khoảng 80% nguồn tài nguyên tính toán mới xây dựng hiện đang không được sử dụng.

- Cơn sốt xây dựng trung tâm dữ liệu AI bắt đầu sau khi ChatGPT ra mắt vào cuối năm 2022, khi chính phủ Trung quốc chỉ định hạ tầng AI là ưu tiên quốc gia và thúc đẩy chính quyền địa phương phát triển các trung tâm tính toán thông minh.

- Nhiều doanh nghiệp không có kinh nghiệm trong lĩnh vực AI đã nhảy vào đầu tư, bao gồm cả công ty sản xuất bột ngọt và công ty dệt may, với mục đích tận dụng trào lưu này để mở rộng kinh doanh hoặc tăng giá cổ phiếu.

- Giá thuê GPU đã giảm mạnh, với máy chủ Nvidia H100 cấu hình 8 GPU hiện cho thuê với giá 75.000 nhân dân tệ mỗi tháng, giảm từ mức cao khoảng 180.000 nhân dân tệ trước đây.

- Sự nổi lên của DeepSeek với mô hình suy luận R1 đã tạo ra bước ngoặt cho ngành AI Trung quốc, thay đổi câu hỏi từ "Ai có thể tạo ra mô hình ngôn ngữ lớn tốt nhất?" sang "Ai có thể sử dụng chúng tốt hơn?".

- Mô hình kinh doanh của nhiều trung tâm dữ liệu đã trở nên lỗi thời khi nhu cầu chuyển từ đào tạo mô hình sang suy luận, đòi hỏi phần cứng có độ trễ thấp và gần các trung tâm công nghệ lớn.

- Nhiều trung tâm dữ liệu được xây dựng ở miền trung, miền tây và nông thôn Trung quốc - nơi điện và đất đai rẻ hơn - đang mất đi sức hấp dẫn đối với các công ty AI.

- Một số nhà điều hành lợi dụng ngành này để được hưởng điện xanh được trợ cấp, lấy giấy phép phát điện và bán lại cho lưới điện với giá cao hơn thay vì sử dụng năng lượng cho AI.

- Mặc dù trung tâm dữ liệu bị sử dụng dưới công suất, chính phủ trung ương Trung quốc vẫn tiếp tục ủng hộ phát triển hạ tầng AI, với Alibaba Group công bố kế hoạch đầu tư hơn 50 tỷ đô la vào điện toán đám mây và hạ tầng phần cứng AI trong ba năm tới.

- Chip Nvidia H20, được thiết kế riêng cho thị trường Trung quốc và được tối ưu hóa cho suy luận AI, hiện là chip Nvidia phổ biến nhất, tiếp theo là H100 vẫn tiếp tục chảy đều vào Trung quốc mặc dù bị hạn chế bởi lệnh trừng phạt của Mỹ.

- Trong cuộc đua AI giữa Trung quốc và Mỹ, các chuyên gia cho rằng Trung quốc khó có thể giảm bớt nỗ lực phát triển hạ tầng, coi đây là "điều ác cần thiết" để phát triển năng lực quan trọng.

- Nhiều trung tâm dữ liệu ở Trung quốc hiện đang trong tình trạng bấp bênh, được xây dựng cho một tương lai chưa đến, với nhận thức rằng rào cản giữa hiện tại và tương lai nơi AI thực sự phổ biến không còn là hạ tầng nữa, mà là kế hoạch triển khai công nghệ.

📌 Trung quốc đã đầu tư xây dựng hơn 500 trung tâm dữ liệu AI trong 2023-2024, nhưng 80% đang bỏ không sử dụng. Sự nổi lên của DeepSeek đã thay đổi nhu cầu từ đào tạo sang suy luận AI, khiến nhiều cơ sở trở nên lỗi thời dù Trung quốc vẫn tiếp tục đầu tư vào lĩnh vực này như một ưu tiên quốc gia.

https://www.technologyreview.com/2025/03/26/1113802/china-ai-data-centers-unused/
#MIT

Trung Quốc xây hàng trăm trung tâm dữ liệu AI để bắt kịp làn sóng AI. Giờ đây nhiều trung tâm không được sử dụng.

Quốc gia này đã đổ hàng tỷ đô vào cơ sở hạ tầng AI, nhưng cơn sốt trung tâm dữ liệu đang tan rã khi các khoản đầu tư đầu cơ va chạm với nhu cầu yếu và DeepSeek thay đổi xu hướng AI.

Tác giả: Caiwei Chen
Ngày 26 tháng 3 năm 2025

Khoảng một năm trước, Xiao Li thấy tràn ngập các thương vụ chip Nvidia trên WeChat. Một nhà thầu bất động sản chuyển sang quản lý dự án trung tâm dữ liệu, anh đã chuyển hướng sang cơ sở hạ tầng AI vào năm 2023, thu hút bởi lời hứa từ cơn sốt AI của Trung Quốc.

Vào thời điểm đó, các thương nhân trong vòng tròn của anh khoe khoang về việc đảm bảo được các lô hàng GPU Nvidia hiệu suất cao vốn thuộc diện hạn chế xuất khẩu của Mỹ. Nhiều chip được buôn lậu qua các kênh hải ngoại đến Thâm Quyến. Tại thời điểm nhu cầu cao nhất, một chip Nvidia H100 duy nhất, loại thiết yếu để huấn luyện các mô hình AI, có thể bán với giá lên đến 200.000 nhân dân tệ (28.000 đô la Mỹ) trên thị trường chợ đen.

Hiện nay, nguồn cấp WeChat và các nhóm chat ngành công nghiệp của anh kể một câu chuyện khác. Các thương nhân kín đáo hơn trong giao dịch, và giá cả đã trở lại mức bình thường. Trong khi đó, hai dự án trung tâm dữ liệu mà Li biết đang gặp khó khăn trong việc đảm bảo tài trợ thêm từ các nhà đầu tư dự đoán lợi nhuận kém, buộc người đứng đầu dự án phải bán bớt GPU dư thừa. "Dường như mọi người đều đang bán, nhưng ít người mua," anh nói.

Chỉ vài tháng trước, làn sóng xây dựng trung tâm dữ liệu đang ở đỉnh cao, được thúc đẩy bởi cả chính phủ và nhà đầu tư tư nhân. Tuy nhiên, nhiều cơ sở mới xây hiện đang bỏ trống. Theo những người trong ngành nói chuyện với MIT Technology Review—bao gồm nhà thầu, một giám đốc điều hành tại một công ty máy chủ GPU, và các quản lý dự án—hầu hết các công ty điều hành các trung tâm dữ liệu này đang vật lộn để tồn tại. Các trang tin địa phương Trung Quốc Jiazi Guangnian và 36Kr báo cáo rằng lên đến 80% nguồn tài nguyên máy tính mới xây dựng của Trung Quốc vẫn chưa được sử dụng.

Cho thuê GPU cho các công ty cần chúng để huấn luyện mô hình AI—mô hình kinh doanh chính cho làn sóng mới của các trung tâm dữ liệu—từng được xem là một khoản đặt cược chắc chắn. Nhưng với sự trỗi dậy của DeepSeek và sự thay đổi đột ngột trong kinh tế xung quanh AI, ngành công nghiệp đang suy yếu.

"Nỗi đau tăng trưởng mà ngành AI Trung Quốc đang trải qua phần lớn là kết quả của các nhà đầu tư thiếu kinh nghiệm—các tập đoàn và chính quyền địa phương—nhảy lên chuyến tàu hype, xây dựng các cơ sở không tối ưu cho nhu cầu hiện tại," Jimmy Goodrich, cố vấn cấp cao về công nghệ cho Tập đoàn RAND, nói.

Hậu quả là các dự án đang thất bại, năng lượng bị lãng phí, và các trung tâm dữ liệu đã trở thành "tài sản khó khăn" mà các nhà đầu tư muốn bán ra với giá thấp hơn thị trường. Tình hình này cuối cùng có thể thúc đẩy sự can thiệp của chính phủ, ông nói: "Chính phủ Trung Quốc có khả năng sẽ can thiệp, tiếp quản và giao chúng cho các nhà điều hành có năng lực hơn."

Một làn sóng xây dựng hỗn loạn

Khi ChatGPT bùng nổ vào cuối năm 2022, phản ứng ở Trung Quốc nhanh chóng. Chính phủ trung ương chỉ định cơ sở hạ tầng AI là ưu tiên quốc gia, thúc giục các chính quyền địa phương đẩy nhanh việc phát triển các trung tâm tính toán thông minh—một thuật ngữ được đặt ra để mô tả các trung tâm dữ liệu tập trung vào AI.

Trong năm 2023 và 2024, hơn 500 dự án trung tâm dữ liệu mới được công bố ở khắp mọi nơi từ Nội Mông đến Quảng Đông, theo KZ Consulting, một công ty nghiên cứu thị trường. Theo Ủy ban Trung tâm Dữ liệu Hiệp hội Công nghiệp Truyền thông Trung Quốc, một hiệp hội ngành công nghiệp liên kết với nhà nước, ít nhất 150 trung tâm dữ liệu mới xây đã hoàn thành và hoạt động vào cuối năm 2024. Các doanh nghiệp nhà nước, các công ty niêm yết, và các quỹ liên kết với nhà nước xếp hàng để đầu tư vào chúng, hy vọng định vị mình là người dẫn đầu AI. Các chính quyền địa phương mạnh mẽ quảng bá chúng với hy vọng sẽ kích thích nền kinh tế và thiết lập khu vực của họ như một trung tâm AI quan trọng.

Tuy nhiên, khi các dự án xây dựng tốn kém này tiếp tục, cơn sốt của Trung Quốc về các mô hình ngôn ngữ lớn đang mất đà. Chỉ trong năm 2024, hơn 144 công ty đăng ký với Cục Quản lý Không gian mạng Trung Quốc—cơ quan quản lý internet trung ương của quốc gia—để phát triển mô hình LLM riêng của họ. Thế nhưng theo Economic Observer, một ấn phẩm Trung Quốc, chỉ khoảng 10% số công ty đó vẫn đang tích cực đầu tư vào việc huấn luyện mô hình quy mô lớn vào cuối năm.

Hệ thống chính trị của Trung Quốc rất tập trung, với các quan chức chính quyền địa phương thường thăng tiến thông qua các bổ nhiệm khu vực. Kết quả là, nhiều lãnh đạo địa phương ưu tiên các dự án kinh tế ngắn hạn cho thấy kết quả nhanh chóng—thường để có được sự ưu ái từ cấp trên—hơn là phát triển dài hạn. Các dự án cơ sở hạ tầng lớn, nổi bật từ lâu đã là công cụ để các quan chức địa phương thúc đẩy sự nghiệp chính trị của họ.

Sự suy thoái kinh tế hậu đại dịch chỉ làm tăng cường xu hướng này. Với lĩnh vực bất động sản Trung Quốc—từng là xương sống của các nền kinh tế địa phương—suy giảm lần đầu tiên trong nhiều thập kỷ, các quan chức chạy đua để tìm động lực tăng trưởng thay thế. Trong khi đó, ngành công nghiệp internet từng phát triển mạnh mẽ của nước này cũng đang bước vào giai đoạn trì trệ. Trong khoảng trống này, cơ sở hạ tầng AI trở thành kích thích kinh tế mới được lựa chọn.

"AI cảm giác như một liều adrenaline," Li nói. "Rất nhiều tiền từng chảy vào bất động sản giờ đang đổ vào các trung tâm dữ liệu AI."

Đến năm 2023, các tập đoàn lớn—nhiều công ty trong số đó có ít kinh nghiệm trước đây về AI—bắt đầu hợp tác với các chính quyền địa phương để tận dụng xu hướng này. Một số xem cơ sở hạ tầng AI như một cách để biện minh cho việc mở rộng kinh doanh hoặc thúc đẩy giá cổ phiếu, Fang Cunbao, một quản lý dự án trung tâm dữ liệu có trụ sở tại Bắc Kinh cho biết. Trong số đó có các công ty như Lotus, nhà sản xuất MSG, và Jinlun Technology, một công ty dệt may—khó có thể là những cái tên người ta liên tưởng đến công nghệ AI tiên tiến.

Cách tiếp cận kiểu đổ xô tìm vàng này có nghĩa là việc thúc đẩy xây dựng các trung tâm dữ liệu AI phần lớn được thúc đẩy từ trên xuống, thường ít quan tâm đến nhu cầu thực tế hoặc tính khả thi kỹ thuật, theo lời Fang, Li, và nhiều nguồn tin tại chỗ, những người yêu cầu được giấu tên vì sợ hậu quả chính trị. Nhiều dự án được dẫn dắt bởi các giám đốc điều hành và nhà đầu tư có kinh nghiệm hạn chế về cơ sở hạ tầng AI, họ nói. Trong cuộc đua để theo kịp, nhiều dự án được xây dựng vội vã và không đạt tiêu chuẩn ngành.

"Kết hợp tất cả các cụm chip lớn này lại với nhau là một công việc rất khó khăn, và có rất ít công ty hoặc cá nhân biết cách thực hiện nó ở quy mô lớn," Goodrich nói. "Đây thực sự là kỹ thuật máy tính tiên tiến nhất. Tôi sẽ ngạc nhiên nếu hầu hết các nhà đầu tư nhỏ hơn này biết cách làm điều đó. Rất nhiều trung tâm dữ liệu mới xây được nhanh chóng kết nối với nhau và không mang lại sự ổn định mà một công ty như DeepSeek muốn."

Để làm cho vấn đề tồi tệ hơn, người đứng đầu dự án thường dựa vào người trung gian và môi giới—một số trong đó đã phóng đại dự báo nhu cầu hoặc thao túng quy trình mua sắm để bỏ túi trợ cấp của chính phủ, các nguồn tin cho biết.

Vào cuối năm 2024, sự hào hứng từng bao quanh làn sóng trung tâm dữ liệu của Trung Quốc đang biến thành thất vọng. Lý do rất đơn giản: cho thuê GPU không còn là một doanh nghiệp đặc biệt sinh lợi.

Sự tỉnh ngộ DeepSeek

Mô hình kinh doanh của các trung tâm dữ liệu về lý thuyết là đơn giản: Chúng kiếm tiền bằng cách cho thuê các cụm GPU cho các công ty cần năng lực tính toán để huấn luyện AI. Tuy nhiên, trong thực tế, việc đảm bảo khách hàng đang trở nên khó khăn. Chỉ một vài công ty công nghệ hàng đầu tại Trung Quốc hiện đang sử dụng nhiều năng lực tính toán để huấn luyện các mô hình AI của họ. Nhiều nhà đầu tư nhỏ hơn đã từ bỏ việc tiền huấn luyện mô hình của họ hoặc thay đổi chiến lược kể từ khi DeepSeek trỗi dậy, công ty đã gây chấn động internet với R1, mô hình suy luận mã nguồn mở của họ có hiệu suất tương đương với ChatGPT o1 nhưng được xây dựng với chi phí chỉ bằng một phần nhỏ.

"DeepSeek là thời điểm tỉnh ngộ cho ngành công nghiệp AI Trung Quốc. Câu hỏi nóng bỏng chuyển từ 'Ai có thể tạo ra mô hình ngôn ngữ lớn tốt nhất?' sang 'Ai có thể sử dụng chúng tốt hơn?'" Hancheng Cao, giáo sư trợ lý về hệ thống thông tin tại Đại học Emory cho biết.

Sự trỗi dậy của các mô hình suy luận như R1 của DeepSeek và ChatGPT o1 và o3 của OpenAI cũng đã thay đổi những gì các doanh nghiệp muốn từ một trung tâm dữ liệu. Với công nghệ này, hầu hết nhu cầu tính toán đến từ việc thực hiện suy luận logic từng bước để đáp ứng các truy vấn của người dùng, không phải từ quá trình huấn luyện và tạo ra mô hình ngay từ đầu. Quá trình suy luận này thường mang lại kết quả tốt hơn nhưng mất nhiều thời gian hơn đáng kể. Do đó, phần cứng với độ trễ thấp (thời gian cần thiết để dữ liệu đi từ một điểm trên mạng đến điểm khác) là tối quan trọng. Các trung tâm dữ liệu cần được đặt gần các trung tâm công nghệ lớn để giảm thiểu độ trễ truyền tải và đảm bảo tiếp cận với nhân viên vận hành và bảo trì có kỹ năng cao.

Sự thay đổi này có nghĩa là nhiều trung tâm dữ liệu được xây dựng ở miền Trung, miền Tây và nông thôn Trung Quốc—nơi điện và đất đai rẻ hơn—đang mất đi sức hấp dẫn đối với các công ty AI. Tại Trịnh Châu, một thành phố ở tỉnh quê hương Hà Nam của Li, một trung tâm dữ liệu mới xây thậm chí đang phân phối phiếu tính toán miễn phí cho các công ty công nghệ địa phương nhưng vẫn khó khăn trong việc thu hút khách hàng.

Ngoài ra, rất nhiều trung tâm dữ liệu mới xuất hiện trong những năm gần đây được tối ưu hóa cho các khối lượng công việc tiền huấn luyện—các phép tính lớn, liên tục chạy trên các tập dữ liệu khổng lồ—hơn là cho suy luận, quá trình chạy các mô hình suy luận đã được huấn luyện để đáp ứng đầu vào của người dùng trong thời gian thực. Phần cứng thân thiện với suy luận khác với những gì được sử dụng truyền thống cho huấn luyện AI quy mô lớn.

GPU như Nvidia H100 và A100 được thiết kế cho xử lý dữ liệu lớn, ưu tiên tốc độ và dung lượng bộ nhớ. Nhưng khi AI hướng tới suy luận thời gian thực, ngành công nghiệp tìm kiếm chip hiệu quả hơn, phản hồi nhanh hơn và tiết kiệm chi phí hơn. Ngay cả một tính toán sai nhỏ trong nhu cầu cơ sở hạ tầng cũng có thể khiến một trung tâm dữ liệu trở nên không tối ưu cho các nhiệm vụ mà khách hàng yêu cầu.

Trong những tình huống này, giá thuê GPU đã giảm xuống mức thấp nhất mọi thời đại. Một báo cáo gần đây từ trang truyền thông Trung Quốc Zhineng Yongxian cho biết rằng một máy chủ Nvidia H100 được cấu hình với 8 GPU hiện cho thuê với giá 75.000 nhân dân tệ mỗi tháng, giảm từ mức cao khoảng 180.000. Một số trung tâm dữ liệu thà để cơ sở của họ bỏ không còn hơn là chấp nhận rủi ro mất nhiều tiền hơn vì chúng rất tốn kém để vận hành, Fan nói: "Doanh thu từ việc chỉ một phần nhỏ của trung tâm dữ liệu hoạt động đơn giản là không đủ để chi trả chi phí điện và bảo trì."

"Thật nghịch lý—Trung Quốc phải đối mặt với chi phí mua chip Nvidia cao nhất, nhưng giá cho thuê GPU lại cực kỳ thấp," Li nói. Có sự dư thừa năng lực tính toán, đặc biệt là ở miền Trung và miền Tây Trung Quốc, nhưng đồng thời, có sự thiếu hụt chip tiên tiến.

Tuy nhiên, không phải tất cả các môi giới đều tìm cách kiếm tiền từ trung tâm dữ liệu ngay từ đầu. Thay vào đó, nhiều người quan tâm đến việc khai thác lợi ích của chính phủ từ trước. Một số nhà điều hành khai thác lĩnh vực này để được cấp điện xanh được trợ cấp, lấy giấy phép để tạo ra và bán điện, theo Fang và một số báo cáo truyền thông Trung Quốc. Thay vì sử dụng năng lượng cho khối lượng công việc AI, họ bán lại cho lưới điện với giá cao hơn. Trong các trường hợp khác, các công ty mua đất cho phát triển trung tâm dữ liệu để đủ điều kiện nhận khoản vay và tín dụng hỗ trợ của nhà nước, để các cơ sở không sử dụng trong khi vẫn được hưởng lợi từ tài trợ của nhà nước, theo trang tin địa phương Jiazi Guangnian.

"Đến cuối năm 2024, không có nhà thầu và môi giới sáng suốt nào trên thị trường vẫn sẽ tham gia kinh doanh kỳ vọng lợi nhuận trực tiếp," Fang nói. "Mọi người tôi gặp đều đang tận dụng thỏa thuận trung tâm dữ liệu cho điều gì đó khác mà chính phủ có thể cung cấp."

Một điều ác cần thiết

Mặc dù việc không sử dụng đầy đủ các trung tâm dữ liệu, chính phủ trung ương Trung Quốc vẫn đang ủng hộ mạnh mẽ cho việc thúc đẩy cơ sở hạ tầng AI. Vào đầu năm 2025, chính phủ đã triệu tập một hội thảo ngành công nghiệp AI, nhấn mạnh tầm quan trọng của tự chủ trong công nghệ này.

Các công ty công nghệ lớn của Trung Quốc đang ghi nhận, thực hiện các khoản đầu tư phù hợp với ưu tiên quốc gia này. Tập đoàn Alibaba công bố kế hoạch đầu tư hơn 50 tỷ đô la vào điện toán đám mây và cơ sở hạ tầng phần cứng AI trong ba năm tới, trong khi ByteDance lên kế hoạch đầu tư khoảng 20 tỷ đô la vào GPU và trung tâm dữ liệu.

Trong khi đó, các công ty ở Mỹ cũng đang làm tương tự. Các công ty công nghệ lớn bao gồm OpenAI, Softbank và Oracle đã hợp tác để cam kết cho sáng kiến Stargate, kế hoạch đầu tư lên đến 500 tỷ đô la trong bốn năm tới để xây dựng các trung tâm dữ liệu tiên tiến và cơ sở hạ tầng tính toán. Với sự cạnh tranh AI giữa hai quốc gia, các chuyên gia cho rằng Trung Quốc không có khả năng thu hẹp nỗ lực của mình. "Nếu AI tạo sinh sẽ là công nghệ then chốt, cơ sở hạ tầng sẽ là yếu tố quyết định thành công," Goodrich, cố vấn chính sách công nghệ cho RAND, nói.

"Chính phủ trung ương Trung Quốc có thể sẽ xem [các trung tâm dữ liệu chưa được sử dụng] như một điều ác cần thiết để phát triển một khả năng quan trọng, một loại đau đớn khi tăng trưởng. Bạn có các dự án thất bại và tài sản khó khăn, và nhà nước sẽ hợp nhất và dọn dẹp nó. Họ thấy đích đến, không phải phương tiện," Goodrich nói.

Nhu cầu vẫn mạnh mẽ đối với chip Nvidia, và đặc biệt là chip H20, được thiết kế tùy chỉnh cho thị trường Trung Quốc. Một nguồn tin trong ngành, người yêu cầu không được xác định theo chính sách công ty của anh, xác nhận rằng H20, một mô hình nhẹ hơn, nhanh hơn được tối ưu hóa cho suy luận AI, hiện là chip Nvidia phổ biến nhất, tiếp theo là H100, vẫn tiếp tục chảy đều vào Trung Quốc mặc dù việc bán hàng chính thức bị hạn chế bởi lệnh trừng phạt của Mỹ. Một số nhu cầu mới được thúc đẩy bởi các công ty triển khai phiên bản riêng của các mô hình mã nguồn mở của DeepSeek.

Hiện tại, nhiều trung tâm dữ liệu ở Trung Quốc đang trong tình trạng lưỡng lự—được xây dựng cho một tương lai chưa đến. Liệu chúng có tìm được cuộc sống thứ hai vẫn chưa chắc chắn. Đối với Fang Cunbao, thành công của DeepSeek đã trở thành khoảnh khắc tỉnh ngộ, đặt ra nghi ngờ về giả định rằng sự mở rộng bất tận của cơ sở hạ tầng AI đảm bảo tiến bộ.

Đó chỉ là một huyền thoại, anh giờ đây nhận ra. Vào đầu năm nay, Fang quyết định từ bỏ ngành công nghiệp trung tâm dữ liệu hoàn toàn. "Thị trường quá hỗn loạn. Những người áp dụng sớm đã kiếm lợi, nhưng bây giờ chỉ là những người săn đuổi lỗ hổng chính sách," anh nói. Anh đã quyết định chuyển sang giáo dục AI tiếp theo.

"Điều đứng giữa hiện tại và tương lai nơi AI thực sự ở khắp mọi nơi," anh nói, "không còn là cơ sở hạ tầng nữa, mà là kế hoạch vững chắc để triển khai công nghệ."

Tác giả: Caiwei Chen

Không có file đính kèm.

Nguồn tham khảo

AI benchmark AI chips-hardware-compute 2025-04-04 06:32:04

2 tiêu chuẩn đánh giá mới từ MLCommons giúp đo lường tốc độ chạy ứng dụng AI

- Tổ chức MLCommons vừa công bố 2 tiêu chuẩn đánh giá mới giúp xác định tốc độ phần cứng và phần mềm hàng đầu có thể chạy các ứng dụng AI.

- Kể từ khi ChatGPT ra mắt hơn 2 năm trước, các công ty chip đã chuyển hướng tập trung vào việc sản xuất phần cứng có thể chạy hiệu quả mã nguồn cho phép hàng triệu người sử dụng công cụ AI.

- Tiêu chuẩn đánh giá đầu tiên dựa trên mô hình AI Llama 3.1 với 405 tỷ tham số của Meta, nhắm vào khả năng trả lời câu hỏi chung, toán học và tạo mã. Định dạng mới này kiểm tra khả năng xử lý truy vấn lớn và tổng hợp dữ liệu từ nhiều nguồn.

- Nvidia đã gửi nhiều loại chip của mình để đánh giá, cùng với các nhà sản xuất hệ thống như Dell Technologies. Theo dữ liệu từ MLCommons, Advanced Micro Devices (AMD) không có bài đánh giá nào cho tiêu chuẩn mô hình lớn 405 tỷ tham số.

- Máy chủ AI thế hệ mới nhất của Nvidia - Grace Blackwell, chứa 72 đơn vị xử lý đồ họa (GPU) - nhanh hơn 2,8 đến 3,4 lần so với thế hệ trước, ngay cả khi chỉ sử dụng 8 GPU trong máy chủ mới để tạo so sánh trực tiếp với mô hình cũ.

- Nvidia đang nỗ lực tăng tốc kết nối giữa các chip trong máy chủ, điều này đặc biệt quan trọng trong công việc AI khi chatbot chạy trên nhiều chip cùng lúc.

- Tiêu chuẩn đánh giá thứ hai cũng dựa trên mô hình AI nguồn mở do Meta xây dựng và nhằm mô phỏng chính xác hơn kỳ vọng về hiệu suất của các ứng dụng AI tiêu dùng như ChatGPT.

- Các tiêu chuẩn mới này được phát triển khi các mô hình cơ bản cần phải đáp ứng nhiều truy vấn hơn để cung cấp năng lượng cho các ứng dụng AI như chatbot và công cụ tìm kiếm.

📌 MLCommons đã phát triển 2 tiêu chuẩn đánh giá mới để đo lường tốc độ chạy ứng dụng AI, với máy chủ Grace Blackwell của Nvidia dẫn đầu, nhanh hơn 3,4 lần so với thế hệ trước. Các tiêu chuẩn này dựa trên mô hình Llama 3.1 405 tỷ tham số của Meta, giúp đánh giá khả năng xử lý truy vấn phức tạp.

https://www.reuters.com/technology/artificial-intelligence/new-ai-benchmarks-test-speed-running-ai-applications-2025-04-02/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-04-04 01:45:40

Malaysia đang nổi lên như một trung tâm dữ liệu quan trọng cho các công ty công nghệ AI Trung Quốc

- Malaysia đang nhanh chóng trở thành mặt trận quan trọng trong cuộc đua vũ trang điện toán toàn cầu, khi các gã khổng lồ công nghệ phương Tây và Trung Quốc đổ xô xây dựng trung tâm dữ liệu để vận hành các mô hình AI.

- Theo dự báo của IDC, đến cuối năm 2025, nhu cầu điện toán toàn cầu sẽ tăng gấp 10 lần so với mức năm 2023, với hơn 40% đến từ khu vực châu Á-Thái Bình Dương.

- Tính đến năm 2024, Malaysia đã hỗ trợ 54 trung tâm dữ liệu với tổng công suất 504,9 megawatt, gần gấp đôi công suất năm 2021, theo hiệp hội thương mại công nghệ Malaysia PIKOM.

- Công suất này sẽ tăng gấp đôi khi cơ sở mới khổng lồ của YTL Corporation đi vào hoạt động. Khu trung tâm dữ liệu rộng 111 hecta này sẽ có công suất 605 megawatt, với giai đoạn đầu dự kiến hoạt động vào tháng 5.

- Đối với các công ty Trung Quốc, Malaysia cung cấp nhiều lợi thế hấp dẫn: quan hệ ổn định với Trung Quốc, chi phí điện thấp, và khả năng tiếp cận bán dẫn tiên tiến không có sẵn ở Trung Quốc do các biện pháp kiểm soát xuất khẩu của Mỹ.

- Joe Gao, thành viên hội đồng quản trị IBuffett Investment Management, cho biết: "Các công ty Trung Quốc là khách hàng chính của trung tâm dữ liệu ở Malaysia và các khu vực Đông Nam Á khác."

- Alibaba Cloud mở trung tâm dữ liệu ở Malaysia vào cuối những năm 2010. ByteDance, công ty sở hữu TikTok, đã khai trương giai đoạn đầu của tổ hợp trung tâm dữ liệu ở bang Johor năm 2022, trải rộng trên hơn 15 hecta.

- Hiện có hàng chục nghìn công ty Trung Quốc đang sử dụng trung tâm dữ liệu ở Malaysia, theo Gao. Nhiều công ty đầu tư vào cơ sở nước ngoài để lưu trữ dữ liệu từ mạng xã hội, nền tảng video ngắn và kinh doanh thương mại điện tử.

- Yếu tố thay đổi cuộc chơi là sự phát triển của AI tạo sinh, làm tăng đột biến nhu cầu về cơ sở dữ liệu. Các công ty Trung Quốc hiện chủ yếu đầu tư vào trung tâm dữ liệu để đào tạo mô hình AI và lưu trữ dữ liệu.

- Malaysia có chi phí vận hành trung tâm dữ liệu thấp hơn 30% so với Singapore. Tuy nhiên, sự bùng nổ này cũng gây ra các vấn đề môi trường. Bang Johor đã bắt đầu từ chối một số đơn xin xây dựng trung tâm dữ liệu, viện dẫn áp lực lên tài nguyên của khu vực.

- Rủi ro địa chính trị cũng hiện hữu - khả năng Malaysia bị cuốn vào cuộc chiến công nghệ Mỹ-Trung. Mỹ có thể áp đặt các quy định "biết khách hàng của bạn" nghiêm ngặt hơn, yêu cầu khách hàng trung tâm dữ liệu đăng ký danh tính thật.

- Thách thức khác là thời tiết Malaysia luôn ấm áp, khiến nước là lựa chọn duy nhất để làm mát trung tâm dữ liệu mật độ cao, không như một số quốc gia sử dụng làm mát bằng gió.

📌 Malaysia đã trở thành điểm đến hàng đầu cho trung tâm dữ liệu của các công ty công nghệ Trung Quốc với 54 trung tâm (504,9 megawatt) vào năm 2024. Lợi thế cạnh tranh bao gồm chi phí thấp hơn 30% so với Singapore và khả năng tiếp cận chip tiên tiến, tuy nhiên đối mặt với thách thức về môi trường và rủi ro địa chính trị.

https://www.scmp.com/economy/china-economy/article/3304927/how-malaysias-data-centres-became-engine-powering-chinas-ai-ambitions

Các trung tâm dữ liệu Malaysia trở thành động lực thúc đẩy tham vọng AI của Trung Quốc

Các gã khổng lồ công nghệ Trung Quốc đang đổ xô xây dựng trung tâm dữ liệu ở Malaysia, nơi cung cấp năng lượng giá rẻ và khả năng tiếp cận chip công nghệ tiên tiến

Thời gian đọc: 4 phút

Minh họa: Lau Ka-kuen

Ralph Jennings tại Petaling Jaya, Malaysia Xuất bản: 8:45 sáng, 3 tháng 4.2025

Ngay bên cạnh một đường cao tốc hẹp ở vùng nông thôn Malaysia, một cụm công trình khổng lồ được bao quanh bởi hàng loạt tấm pin mặt trời vươn cao hơn các đồn điền cọ xung quanh.

Khu vực rộng 275 mẫu Anh (111 hecta) này, được xây dựng bởi tập đoàn địa phương YTL Corporation, chứa đầy các trung tâm dữ liệu để phục vụ nhu cầu bùng nổ về sức mạnh xử lý tại quốc gia Đông Nam Á này.

Malaysia đang nhanh chóng nổi lên như một mặt trận quan trọng trong cuộc chạy đua vũ trang điện toán toàn cầu, khi các gã khổng lồ công nghệ phương Tây và Trung Quốc đổ xô xây dựng trung tâm dữ liệu để cung cấp năng lượng cho các mô hình trí tuệ nhân tạo đang phát triển của họ.

Đến cuối năm 2025, nhu cầu toàn cầu về sức mạnh điện toán sẽ tăng vọt lên gấp 10 lần so với mức năm 2023, với hơn 40% đến từ khu vực Châu Á-Thái Bình Dương, công ty nghiên cứu IDC dự đoán.

Nhiều máy chủ bổ sung đó tập trung ở Malaysia, khi quốc gia này trở thành nam châm thu hút các công ty công nghệ Trung Quốc.

Đối với các công ty Trung Quốc, Malaysia mang đến sự kết hợp hấp dẫn của nhiều lợi thế, bao gồm quan hệ ổn định với Trung Quốc, chi phí điện thấp và khả năng tiếp cận rộng rãi hơn với các bán dẫn tiên tiến không có sẵn ở Trung Quốc do các biện pháp kiểm soát xuất khẩu của Mỹ, các nhà phân tích cho biết.

"Các công ty Trung Quốc là khách hàng chính của các trung tâm dữ liệu ở Malaysia và các khu vực Đông Nam Á khác," Joe Gao, thành viên hội đồng quản trị của IBuffett Investment Management, một công ty đầu tư chuyên về các doanh nghiệp AI Trung Quốc nhắm vào thị trường Đông Nam Á, cho biết.

"Chúng tôi biết rằng khi cuộc cách mạng AI này diễn ra, các trung tâm dữ liệu sẽ thực sự bùng nổ" - Yeoh Keong Hann, YTL Corporation

Các trung tâm điện toán đã mọc lên khắp Malaysia trong vài năm qua. Tính đến năm 2024, quốc gia này hỗ trợ 54 trung tâm dữ liệu với tổng công suất 504,9 megawatt, gần gấp đôi công suất năm 2021, theo hiệp hội thương mại công nghệ Malaysia PIKOM.

Và công suất đó sẽ tăng gấp đôi một lần nữa khi cơ sở mới khổng lồ của YTL mở cửa. Khu trung tâm dữ liệu rộng lớn này cuối cùng sẽ có công suất 605 megawatt, YTL cho biết với Post, với giai đoạn đầu của dự án dự kiến đi vào hoạt động vào tháng 5.

"Chúng tôi biết rằng khi cuộc cách mạng AI này diễn ra, các trung tâm dữ liệu sẽ thực sự bùng nổ," Yeoh Keong Hann, một giám đốc cấp cao tại YTL, cho biết trong một cuộc phỏng vấn tại trụ sở cao ốc hiện đại của công ty ở Kuala Lumpur.

"Malaysia đã ở vị trí may mắn khi có năng lượng, nước, đất đai và nhân tài để thúc đẩy lĩnh vực tăng trưởng mới này."

Malaysia đã dần dần vượt qua Singapore láng giềng để trở thành điểm đến hàng đầu trong khu vực cho các trung tâm dữ liệu mới trong vài năm qua.

Là quốc gia đi đầu trong lĩnh vực này, Singapore cuối cùng nhận thấy các cơ sở này tạo ra quá nhiều áp lực lên tài nguyên đất, nước và năng lượng khan hiếm của mình. Vào năm 2019, thành phố này đã đặt lệnh tạm hoãn các dự án trung tâm dữ liệu mới trong khi tìm cách đưa ngành công nghiệp này vào mục tiêu khí hậu của mình.

Nhưng Malaysia đã đón nhận ngành công nghiệp này, và nó nhanh chóng bắt đầu thu hút đầu tư từ các công ty công nghệ Trung Quốc nhắm vào thị trường Đông Nam Á đang phát triển nhanh chóng.

Bang Johor phía nam đã trở thành trung tâm cho các trung tâm dữ liệu mới ở Malaysia. Ảnh: AP

Vào cuối những năm 2010, Alibaba Cloud - một bộ phận của gã khổng lồ công nghệ Trung Quốc Alibaba Group Holding - đã mở một trung tâm dữ liệu ở Malaysia để phục vụ các công ty địa phương sử dụng dịch vụ điện toán đám mây của mình. Alibaba là chủ sở hữu của South China Morning Post.

ByteDance, công ty dịch vụ internet có trụ sở tại Bắc Kinh sở hữu TikTok, đã cùng ra mắt giai đoạn đầu tiên của một tổ hợp trung tâm dữ liệu ở bang Johor phía nam Malaysia vào năm 2022, chiếm ba tòa nhà trải rộng trên hơn 15 hecta.

Hiện nay, hàng chục nghìn công ty Trung Quốc đang sử dụng trung tâm dữ liệu ở Malaysia, theo Gao.

Trong nhiều trường hợp, các công ty Trung Quốc này đang đầu tư vào các cơ sở nước ngoài để lưu trữ dữ liệu được tạo ra bởi mạng xã hội, nền tảng video ngắn và kinh doanh thương mại điện tử ở nước ngoài của họ.

Ví dụ, hàng loạt công ty Trung Quốc đã nhảy vào thị trường thương mại điện tử Đông Nam Á - dự kiến sẽ tăng gấp đôi quy mô vào năm 2030 - bao gồm Temu của Pinduoduo, Lazada của Alibaba và TikTok Shop của ByteDance.

Theo Yeoh, YTL kỳ vọng khu trung tâm dữ liệu của họ sẽ thu hút nhiều khách hàng muốn "gộp nhu cầu Đông Nam Á lại với nhau".

Nhưng yếu tố thay đổi cuộc chơi thực sự là sự phát triển của AI tạo sinh, đã tạo ra sự gia tăng mạnh mẽ về nhu cầu đối với các cơ sở dữ liệu.

Các công ty Trung Quốc hiện nay chủ yếu tìm cách đầu tư vào trung tâm dữ liệu để đào tạo các mô hình AI và lưu trữ dữ liệu được tạo ra bởi hệ thống AI của họ, theo Alex Liew, chủ tịch hiệp hội thương mại công nghệ Malaysia PIKOM.

"AI rất phát triển ở Trung Quốc," Liew nói. "Nó thu hút nhiều công ty Trung Quốc."

"Malaysia vẫn là điểm đến hợp pháp để mua chip cao cấp... Các công ty Trung Quốc vẫn có thể tiếp cận nguồn lực sức mạnh điện toán thông qua các kênh địa phương" - Joe Gao, nhà đầu tư

Đối với các công ty AI của Trung Quốc, sức hấp dẫn của Malaysia một phần nằm ở chi phí thấp: trung tâm dữ liệu ở đây rẻ hơn 30% so với ở Singapore, theo Liew. Nhưng một lợi thế lớn khác là khả năng tiếp cận của quốc gia này với các vi mạch do Mỹ thiết kế.

"Malaysia vẫn là điểm đến hợp pháp để mua chip cao cấp," Gao nói. "Mặc dù có một số hạn chế về số lượng, các công ty Trung Quốc vẫn có thể tiếp cận nguồn lực sức mạnh điện toán thông qua các kênh địa phương để hỗ trợ đào tạo mô hình AI, sản xuất thông minh và Internet vạn vật."

Có tiềm năng to lớn để tăng trưởng hơn nữa về nhu cầu sức mạnh điện toán ở Đông Nam Á, Gao nói thêm, khi ngành công nghiệp AI tiếp tục phát triển và các lĩnh vực mới nổi khác bao gồm thiết bị nhà thông minh, máy bay không người lái, lái xe tự động và xe điện phát triển mạnh trong khu vực.

Tuy nhiên, sự bùng nổ trong nhu cầu của Trung Quốc cũng mang lại rủi ro cho Malaysia. Quan trọng nhất trong số đó là sự không chắc chắn về địa chính trị - khả năng Malaysia có thể bị cuốn vào cuộc chiến công nghệ Mỹ-Trung.

"Mỹ có thể thực thi các quy định 'biết khách hàng của bạn' nghiêm ngặt hơn, yêu cầu khách hàng trung tâm dữ liệu đăng ký với danh tính thật và tiết lộ quyền sở hữu cuối cùng, hoặc thậm chí hạn chế các trung tâm dữ liệu Đông Nam Á cung cấp sức mạnh điện toán cho các mô hình AI Trung Quốc," Gao nói.

Nếu điều đó xảy ra, nó có thể ảnh hưởng nghiêm trọng đến khả năng tạo ra lợi nhuận của các trung tâm dữ liệu mới của Malaysia.

"Thị trường nội địa của Malaysia, Việt Nam và Thái Lan vẫn có nhu cầu hạn chế đối với đầu tư sức mạnh điện toán cao cấp lớn như vậy, khiến các doanh nghiệp Trung Quốc trở thành khách hàng quan trọng cho các trung tâm dữ liệu Đông Nam Á," Gao nói.

Nhưng khi ngày càng nhiều trung tâm dữ liệu Đông Nam Á áp dụng chip sản xuất tại Trung Quốc, tác động của các biện pháp kiểm soát xuất khẩu của Mỹ sẽ dần yếu đi, theo Gao.

"Đây không chỉ là một xu hướng - nó đại diện cho lợi ích kinh tế hữu hình," ông nói.

Trong khi đó, sự bùng nổ này đang gây ra các vấn đề môi trường có thể khó khắc phục.

Những gì đã làm chậm Singapore đã bắt đầu có dấu hiệu lan rộng vào Malaysia: Johor đã bắt đầu từ chối một số đơn xin trung tâm dữ liệu, viện dẫn áp lực mà các dự án sẽ đặt lên tài nguyên của khu vực.

Lưu trữ dữ liệu cuối cùng có thể gây ra vấn đề trừ khi các cơ sở được cung cấp năng lượng từ nguồn năng lượng tái tạo, Farlina Said, một nhà phân tích cấp cao tại viện nghiên cứu Institute of Strategic & International Studies ở Malaysia cho biết. Quốc gia này đã đặt mục tiêu cắt giảm lượng khí thải nhà kính vào năm 2030.

"Đó là điều Malaysia muốn, nhưng đồng thời một số người đang đặt câu hỏi liệu tài nguyên của chúng ta có ở vị thế tốt để đặt các trung tâm dữ liệu này hay không," bà nói.

Mặc dù Malaysia có nhiều nước để giúp làm mát các trung tâm dữ liệu mật độ cao, nhưng quốc gia này không phải là nơi lý tưởng để đặt các cơ sở này, Liew nói.

"Thách thức với Malaysia là thời tiết của chúng tôi," ông nói. "Nó luôn ấm áp. Không giống như một số quốc gia sử dụng làm mát bằng gió. Nước là lựa chọn duy nhất của chúng tôi."

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute AI viễn thông 2025-04-03 16:16:32

NVIDIA định nghĩa lại tương lai AI tại GTC 2025

GTC 2025 chứng kiến lượng người tham gia trực tiếp đạt 25.000 người (tăng từ 16.000), 800 công ty toàn cầu góp mặt, hơn 400 đơn vị triển lãm.
Jensen Huang công bố chuyển dịch lớn: từ điện toán tuần tự sang điện toán tăng tốc, tập trung vào hiệu suất tạo token – nền tảng của AI tạo sinh và Agentic AI.
Chip Blackwell Ultra mới tăng hiệu suất 50%, lộ trình tiếp theo là Vera Rubin và Rubin Ultra (2026–2027), Rubin Ultra dự kiến tăng hiệu suất gấp 14 lần.
Khái niệm token generation efficiency thay thế các chỉ số truyền thống như TOPS/FLOPS, đo hiệu quả AI bằng số lượng và chất lượng token/s + chi phí/tốc độ/tốc độ tiêu thụ năng lượng.
NVIDIA ra mắt Dynamo – framework nguồn mở tối ưu suy luận phân tán (inference), giúp mô hình như Llama 70B tăng hiệu suất gấp đôi nhờ phân tách prefill và decode.
Dynamo dùng KV cache phân cấp thông minh, hỗ trợ lưu trữ vào RAM hoặc NVMe thay vì HBM đắt đỏ, tăng throughput và giảm latency.
Trong ứng dụng, Dynamo giúp giảm chi phí suy luận, tăng khả năng phục vụ người dùng đồng thời, hỗ trợ chatbot phức tạp, mã nguồn lớn và bối cảnh sâu rộng.
NVIDIA mở rộng dòng sản phẩm DGX, gồm DGX SuperPOD dùng Blackwell Ultra cho doanh nghiệp, và DGX Spark hợp tác MediaTek dành cho AI ở edge.
Khởi động Instant AI Factory với Equinix – dịch vụ AI quản lý hoàn chỉnh, giúp doanh nghiệp triển khai AI mà không cần hạ tầng riêng.
Tại Quantum Day, định hướng AI-quantum hybrid được xác lập. AWS, Microsoft đồng thuận: tích hợp là cách khả thi duy nhất. Ví dụ: IonQ cải thiện 12% mô phỏng bơm máu.
NVIDIA chuyển hướng lại chiến lược AI Enterprise SaaS: thay vì kiếm tiền từ phần mềm, dùng để tạo nhu cầu phần cứng AI, hợp tác với Accenture, HPE, Amdocs, ServiceNow.
Ra mắt khái niệm Neotelco: telco triển khai GPU-as-a-Service (GPUaaS), hướng tới thị trường AI có tính chủ quyền cao. Hợp tác với 12 telco và nhóm phát triển AI-native 6G.
NVIDIA và AI-RAN Alliance thúc đẩy RAN dùng GPU thay vì ASIC, 85 thành viên hiện tại, hướng tới 6G AI-native với sự hỗ trợ từ T-Mobile, Cisco, MITRE.
Triển khai AI vật lý (Physical AI) – chuỗi cảm biến → token → mô hình AI → hành động → phản hồi, dùng các công cụ như Omniverse, Isaac ROS, OpenUSD.
Cơ sở hạ tầng AI vật lý đe dọa mô hình cloud truyền thống, yêu cầu hyperscaler như AWS, Google, Microsoft dịch chuyển sang hỗ trợ orchestrate OT/IT kết hợp.
Công bố ủng hộ Co-Packaged Optics (CPO): dùng silicon photonics tích hợp vào GPU giúp tiết kiệm điện, tăng băng thông. Dự kiến triển khai NVLink CPO từ 2026–2028.

📌 NVIDIA tại GTC 2025 đã tái định nghĩa điện toán AI qua khái niệm hiệu suất tạo token, giới thiệu chip Blackwell Ultra, framework Dynamo, và kiến trúc AI vật lý. Với roadmap rõ ràng và đầu tư lớn vào AI-native 6G, AI inference và quantum hybrid, NVIDIA định hình lại toàn bộ thị trường AI. Dự kiến, hạ tầng AI trị giá 1.000 tỷ USD sẽ triển khai đến 2028. Thách thức gồm chi phí cao, phụ thuộc hệ sinh thái và độ phức tạp trong triển khai.

https://go.abiresearch.com/lp-gtc-2025

📝 TÓM TẮT CHI TIẾT VỀ AI-RAN ALLIANCE VÀ SOVEREIGN AI

AI-RAN Alliance là sáng kiến được công bố mạnh mẽ tại GTC 2025 với mục tiêu "AI hóa" toàn bộ mạng truy cập vô tuyến (Radio Access Network - RAN).
Liên minh này có 85 thành viên trong năm 2025, tăng vọt từ chỉ 15 thành viên một năm trước, cho thấy tốc độ phát triển nhanh chóng và sự quan tâm của ngành.
NVIDIA kỳ vọng GPU sẽ thay thế phần cứng chuyên biệt như ASIC trong các hạ tầng mạng di động, mang lại hiệu suất cao hơn và khả năng lập trình linh hoạt hơn.
Điểm nhấn là hợp tác giữa NVIDIA, T-Mobile, Cisco, MITRE, Booz Allen Hamilton và ORAN Development Company (ODC) để phát triển network stack AI-native cho 6G.
Mục tiêu dài hạn là xây dựng AI-native RAN, nơi AI điều phối mọi khía cạnh của mạng: từ lập kế hoạch, cấu hình, vận hành, phân mảnh mạng, đến giám sát sức khỏe mạng.
NVIDIA cung cấp các công cụ hỗ trợ như:
- Aerial Omniverse Digital Twin (AODT): mô phỏng số mạng di động.
- Aerial Commercial Test Bed: môi trường thử nghiệm thực tế.
- Aerial Sionna: công cụ mã nguồn mở hỗ trợ phát triển thuật toán AI cho mạng.
NVIDIA cũng ra mắt mô hình Agentic AI cho viễn thông dựa trên NIMs (NeMo framework), ứng dụng vào vận hành mạng tự động hóa toàn diện.
SoftBank công bố mô hình AI viễn thông 70 tỷ tham số, được huấn luyện 1 tháng với 4 TB dữ liệu từ 200.000 trạm phát, cho kết quả cải thiện hiệu năng mạng đáng kể.

SOVEREIGN AI – TRỤ CỘT DỮ LIỆU CHỦ QUYỀN

NVIDIA xác định AI chủ quyền (Sovereign AI) là yếu tố sống còn trong bối cảnh nhiều quốc gia muốn kiểm soát dữ liệu và AI trong biên giới quốc gia.
Công ty đã ký hợp đồng với 15 nhà mạng viễn thông tại GTC 2025 để triển khai AI factories cấp quốc gia và khu vực, vận hành như GPU cloud nội địa.
Mô hình triển khai GPU-as-a-Service (GPUaaS) giúp các telco cung cấp hạ tầng AI mà không cần cạnh tranh trực tiếp với các hyperscaler như AWS hay Google.
NVIDIA gọi các nhà mạng đang chuyển mình theo hướng AI này là "Neotelcos" – thế hệ mới của nhà mạng không chỉ kết nối, mà còn xử lý và cung cấp dịch vụ AI.
Thị trường AI sẽ chia thành 3 nhóm chính:
1. Hyperscalers: xử lý mô hình huấn luyện tổng quát quy mô lớn.
2. Neocloud providers (CoreWeave, Lambda Labs...): linh hoạt phục vụ mô hình chuyên biệt, nhu cầu nhỏ.
3. Neotelcos: xử lý bài toán AI mang tính quốc gia, bảo mật cao, yêu cầu không rời khỏi biên giới dữ liệu.
Sovereign AI là giải pháp để các chính phủ và doanh nghiệp địa phương triển khai AI tuân thủ pháp luật, tự chủ công nghệ, và bảo vệ dữ liệu nội địa.
NVIDIA đang xây dựng hạ tầng AI với yếu tố chủ quyền từ đầu, phù hợp với các tiêu chuẩn dữ liệu như GDPR châu Âu hay Luật An ninh mạng Việt Nam.

📌 Tại GTC 2025, NVIDIA khẳng định tham vọng dẫn đầu mạng viễn thông tương lai với AI-RAN Alliance, thúc đẩy 6G AI-native bằng GPU và phần mềm Aerial. Đồng thời, với sáng kiến Sovereign AI, công ty hợp tác với 15 telco để triển khai hạ tầng AI quốc gia. Sự kết hợp giữa AI, mạng viễn thông và chủ quyền dữ liệu tạo ra thị trường Neotelco mới, nơi AI không chỉ là công nghệ mà còn là yếu tố chiến lược quốc gia.

📝 TÓM TẮT CHI TIẾT VỀ MÔ HÌNH AI VIỄN THÔNG 70 TỶ THAM SỐ CỦA SOFTBANK

Tại GTC 2025, SoftBank công bố một trong những bước tiến lớn nhất trong ứng dụng AI cho mạng viễn thông khi giới thiệu mô hình AI chuyên biệt có 70 tỷ tham số (70B parameters).
Đây là mô hình Agentic AI chuyên dành cho mạng viễn thông, được phát triển dựa trên nền tảng NVIDIA NeMo và huấn luyện trên NVIDIA GDX SuperPOD – siêu máy tính AI của NVIDIA.
Quá trình huấn luyện kéo dài 1 tháng, sử dụng 4 Terabyte (TB) dữ liệu thực tế thu thập từ 200.000 trạm phát sóng (cells) – một trong những dataset thực tế lớn nhất từng được dùng trong AI viễn thông.
Mục tiêu của mô hình là cung cấp các tham số tối ưu hóa cho mạng di động nhằm:
- Cải thiện hiệu suất vùng phủ sóng.
- Giảm độ trễ.
- Tăng trải nghiệm người dùng đầu cuối.
- Tự động hóa các quy trình vận hành mạng: cấu hình, giám sát, xử lý sự cố, phân mảnh mạng (network slicing).
Mô hình hoạt động như một hệ thống đa tác vụ AI (Agentic AI), với các tác nhân chuyên biệt có thể phối hợp như:
- Agent lập kế hoạch mạng.
- Agent giám sát trạng thái mạng (NOC).
- Agent cấu hình và triển khai mạng.
- Agent xử lý sự cố theo thời gian thực.
Đây là minh chứng cho chiến lược AI-native RAN mà NVIDIA và AI-RAN Alliance đang thúc đẩy: các mô hình AI không chỉ bổ trợ, mà sẽ điều hành trực tiếp các hoạt động mạng viễn thông.
Việc tích hợp NeMo và GDX SuperPOD giúp SoftBank huấn luyện mô hình này một cách nhanh chóng, tiết kiệm năng lượng, đồng thời duy trì mức hiệu suất token/s cao – yếu tố quan trọng trong các mô hình yêu cầu xử lý thời gian thực.
Với mô hình này, SoftBank đang tiến gần hơn đến mục tiêu fully autonomous telco network – mạng viễn thông tự động toàn phần, không cần can thiệp thủ công từ con người.
Dự án còn đánh dấu bước đột phá trong việc áp dụng mô hình AI lớn (LLM) trong môi trường mạng, khác biệt hoàn toàn với các AI mạng truyền thống dựa vào rule-based logic hoặc heuristic.
NVIDIA coi dự án của SoftBank là hình mẫu tiên phong cho các nhà mạng khác, nhất là trong bối cảnh chủ quyền dữ liệu (sovereign AI) đang trở thành yêu cầu bắt buộc ở nhiều quốc gia.
SoftBank có thể mở đường cho các nhà mạng khác xây dựng mô hình AI nội địa, phục vụ riêng cho quốc gia mình, tạo lợi thế cạnh tranh lớn về chất lượng dịch vụ và hiệu quả vận hành.

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-04-02 10:42:00

Cuộc đua chip AI: Nhật Bản đặt cược 11,5 tỷ USD vào startup 2 tuổi Rapidus

- Rapidus Corp., công ty chip được chính phủ Nhật Bản hậu thuẫn, bắt đầu sản xuất thử nghiệm chip thế hệ tiếp theo vào ngày 01/04/2025.

- Công ty này đặt mục tiêu sản xuất hàng loạt chip bán dẫn sử dụng quy trình 2 nanomet vào năm 2027, ngang bằng với năng lực của TSMC.

- Nhật Bản đã cam kết đầu tư 1,72 nghìn tỷ yên (tương đương 11,5 tỷ USD) để hỗ trợ Rapidus, nhằm lấy lại vị thế công nghệ đã mất cho Mỹ, Đài Loan và Hàn Quốc.

- CEO Atsuyoshi Koike, 72 tuổi, thừa nhận việc phát triển công nghệ 2nm và kiến thức sản xuất hàng loạt là "cực kỳ khó khăn".

- Rapidus đã thực hiện lithography cực tím lần đầu tiên sử dụng thiết bị của ASML Holding NV vào ngày 01/04/2025.

- Lô chip thử nghiệm đầu tiên dự kiến sẽ xuất hiện vào tháng 7/2025.

- Công ty vẫn đúng tiến độ để sản xuất hàng loạt chip tiên tiến tại nhà máy ở đảo Hokkaido phía bắc Nhật Bản.

- Nỗ lực tạo ra một nhà sản xuất chip hợp đồng tiên tiến từ con số 0 đã được các nhà hoạch định chính sách Nhật Bản ủng hộ, do lo ngại về sự phụ thuộc công nghệ vào Đài Loan.

- Tuy nhiên, theo chuyên gia Kazuyoshi Saito từ Iwai Cosmo Securities, việc ra mắt thương mại dây chuyền sản xuất 2nm vào năm 2027 là một mục tiêu khó khăn.

- Để thành công, Rapidus cần phải thành thạo các máy móc mới nhất của ASML, những công cụ mà hầu hết kỹ sư của họ đang lần đầu học cách sử dụng.

📌 Nhật Bản đặt cược 11,5 tỷ USD vào Rapidus để sản xuất chip AI 2nm vào năm 2027, cạnh tranh với TSMC. Dù đầy tham vọng, dự án này đối mặt với nhiều thách thức kỹ thuật và thời gian gấp rút.

https://www.bloomberg.com/news/articles/2025-04-01/japan-s-rapidus-starts-test-production-in-ai-chipmaking-gamble

Rapidus của Nhật Bản bắt đầu sản xuất thử nghiệm trong canh bạc sản xuất chip AI

Rapidus Corp. đang chuẩn bị sản xuất hàng loạt bán dẫn sử dụng quy trình 2-nanomét vào năm 2027.

Nhiếp ảnh gia: Kiyoshi Ota/Bloomberg

Bởi Takashi Mochizuki và Yuki Furukawa Ngày 1 tháng 4 năm 2025 lúc 7:03 sáng UTC

Công ty chip được nhà nước hậu thuẫn Rapidus Corp. của Nhật Bản đã bắt đầu sản xuất thử nghiệm chip thế hệ tiếp theo vào hôm thứ Ba, một bước đầu nhưng quan trọng trong nỗ lực của quốc gia này để tự sản xuất các thành phần trí tuệ nhân tạo.

Công ty hai tuổi này đang chuẩn bị sản xuất hàng loạt bán dẫn sử dụng quy trình 2-nanomét vào năm 2027, điều mà trên lý thuyết sẽ ngang bằng với Taiwan Semiconductor Manufacturing Co. về khả năng sản xuất chip. Nhật Bản đến nay đã dành 1,72 nghìn tỷ yên (11,5 tỷ đô la) để hỗ trợ công ty khởi nghiệp này, một phần trong nỗ lực nhiều năm để lấy lại một phần vị thế dẫn đầu công nghệ mà nước này đã nhường cho Mỹ, Đài Loan và Hàn Quốc.

"Việc phát triển công nghệ 2nm và bí quyết sản xuất hàng loạt là cực kỳ khó khăn," và còn nhiều thử nghiệm phía trước, Giám đốc điều hành Atsuyoshi Koike, 72 tuổi, đã nói tại một cuộc họp báo. "Chúng tôi sẽ thực hiện từng bước một để giảm tỷ lệ lỗi và đảm bảo niềm tin của khách hàng."

Rapidus đã tiến hành quang khắc cực tím cực đoan sử dụng thiết bị của ASML Holding NV lần đầu tiên vào hôm thứ Ba, Koike cho biết. Lô chip thử nghiệm đầu tiên có thể sẽ xuất hiện vào tháng 7, và công ty vẫn đúng tiến độ để sản xuất hàng loạt chip tiên tiến tại nhà máy của mình trên đảo Hokkaido phía bắc, ông nói.

Nỗ lực tạo ra một nhà sản xuất chip theo hợp đồng công nghệ hàng đầu từ đầu đã thuyết phục các nhà hoạch định chính sách của quốc gia khi nỗi lo ngại về sự phụ thuộc công nghệ vào Đài Loan, mà Trung Quốc tuyên bố là lãnh thổ của mình, ngày càng sâu sắc.

Mặc dù có sự hỗ trợ hàng tỷ đô la từ chính phủ, việc ra mắt thương mại các dây chuyền sản xuất 2nm vào năm 2027 là một cơ hội nhỏ, theo nhà phân tích Kazuyoshi Saito của Iwai Cosmo Securities Co. Để thành công, Rapidus sẽ cần phải làm chủ các máy móc mới nhất của ASML, những công cụ mà hầu hết các kỹ sư của họ đang học cách sử dụng lần đầu tiên.

"Nhảy thẳng vào sản xuất bán dẫn tân tiến nhất là gần như không thực tế," ông nói.

Không có file đính kèm.

Nguồn tham khảo

Semi-Cloud-DC-Green AI chips-hardware-compute 2025-04-02 10:36:31

Microsoft hủy bỏ nhiều dự án trung tâm dữ liệu trị giá hàng tỷ USD

- Microsoft đã hủy bỏ các hợp đồng thuê với ít nhất 2 nhà điều hành trung tâm dữ liệu tư nhân ở Mỹ, tổng cộng "vài trăm megawatt", theo phân tích từ TD Cowen.

- Công ty cũng không chuyển đổi các "tuyên bố về trình độ chuyên môn" thành hợp đồng thuê, cho thấy sự thay đổi trong chiến lược đầu tư cơ sở hạ tầng.

- Sau khi thông tin này được tiết lộ, Microsoft đã rút khỏi thỏa thuận trị giá 12 tỷ USD với CoreWeave (được gọi là "WeWork của AI"), từ chối mua thêm công suất trung tâm dữ liệu từ nhà cung cấp siêu quy mô AI này.

- Đáng chú ý, OpenAI đã nhanh chóng nắm bắt cơ hội này, nhưng vì Microsoft là nhà đầu tư lớn nhất của OpenAI, về cơ bản OpenAI đang thanh toán cho CoreWeave bằng tiền của Microsoft.

- Theo báo cáo mới từ Bloomberg trích dẫn các nhà phân tích TD Cowen, Microsoft đã từ bỏ các dự án trung tâm dữ liệu bổ sung ở Mỹ và châu Âu trong sáu tháng qua.

- Việc cắt giảm này bao gồm hủy bỏ và hoãn các hợp đồng thuê, với Google đã nhanh chóng giành lấy một số hợp đồng thuê mà Microsoft từ bỏ ở châu Âu.

- Meta Platforms cũng đã tiếp quản một số công suất được giải phóng ở châu Âu, tận dụng cơ hội từ việc Microsoft rút lui.

- Phản hồi về thông tin này, Microsoft nhấn mạnh rằng họ vẫn đang trên đà chi khoảng 80 tỷ USD đầu tư vào các dự án cơ sở hạ tầng đang phát triển.

- Người phát ngôn của Microsoft tuyên bố: "Nhờ những khoản đầu tư đáng kể chúng tôi đã thực hiện cho đến thời điểm này, chúng tôi đang ở vị thế tốt để đáp ứng nhu cầu khách hàng hiện tại và ngày càng tăng."

- Microsoft cũng thừa nhận họ có thể "điều chỉnh chiến lược hoặc điều chỉnh cơ sở hạ tầng ở một số khu vực", nhưng khẳng định sẽ "tiếp tục tăng trưởng mạnh mẽ ở tất cả các khu vực" và "đầu tư và phân bổ nguồn lực cho các lĩnh vực tăng trưởng trong tương lai."

📌 Microsoft đang điều chỉnh chiến lược đầu tư trung tâm dữ liệu, hủy bỏ nhiều dự án trị giá hàng tỷ USD ở Mỹ và châu Âu. Trong khi đó, Google và Meta nhanh chóng nắm bắt cơ hội này. Dù vậy, Microsoft vẫn cam kết đầu tư 80 tỷ USD vào cơ sở hạ tầng để đáp ứng nhu cầu ngày càng tăng.

https://www.techradar.com/pro/microsoft-skirts-around-rumors-that-it-has-cancelled-several-data-center-projects-worth-billions-of-dollars

Không có file đính kèm.

Nguồn tham khảo

118

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-03-30 23:49:45

Bùng nổ trung tâm dữ liệu AI: Meta đổ 10 tỷ USD vào vùng nông thôn Mỹ

Meta đang xây dựng trung tâm dữ liệu AI lớn nhất từ trước đến nay tại Holly Ridge, Louisiana, với diện tích 2.700 mẫu Anh và chi phí 10 tỷ USD.
Dự án sẽ tạo ra khoảng 500 việc làm thường xuyên với mức lương trung bình 82.000 USD/năm, cao hơn nhiều so với thu nhập trung bình của địa phương là 53.000 USD.
Trung tâm dữ liệu sẽ tiêu thụ khoảng 15% sản lượng điện hiện tại của Louisiana. Công ty điện lực Entergy dự kiến đầu tư 3,2 tỷ USD xây dựng 3 nhà máy điện khí đốt để đáp ứng nhu cầu.
Dự án mang lại cơ hội phát triển kinh tế cho vùng nông thôn nghèo, nhưng cũng gây lo ngại về chi phí điện năng cho người dân địa phương nếu Meta rút lui trong tương lai.
Các công ty công nghệ lớn đang tìm kiếm đất rộng, đường dây truyền tải và khí đốt tự nhiên ở vùng nông thôn Mỹ để xây dựng trung tâm dữ liệu AI.
Louisiana đã thông qua ưu đãi miễn thuế bán hàng cho thiết bị trung tâm dữ liệu để thu hút Meta.
Dự án được kỳ vọng sẽ thúc đẩy phát triển nhà ở và cơ sở hạ tầng tại địa phương.
Một số lo ngại về rủi ro nếu nhu cầu điện của Meta giảm trong tương lai, khiến người dân phải gánh chi phí cơ sở hạ tầng điện.
Meta cho biết đây là "dự án quan trọng nhất" họ từng thực hiện, nhằm đáp ứng nhu cầu ngày càng tăng về năng lực xử lý AI.

📌 Meta đầu tư 10 tỷ USD vào trung tâm dữ liệu AI 4 triệu m2 tại Louisiana, tạo 500 việc làm với lương 82.000 USD/năm. Dự án mang lại cơ hội phát triển kinh tế nhưng cũng gây lo ngại về chi phí điện năng dài hạn cho người dân địa phương.

https://www.wsj.com/business/energy-oil/the-ai-data-center-boom-is-coming-to-americas-heartland-eb060a32

#WSJ

Cơn sốt trung tâm dữ liệu AI đang đến với vùng trung tâm nước Mỹ

Meta và các công ty công nghệ khác đang tìm kiếm đất nông thôn Mỹ, đường dây truyền tải điện và khí đốt tự nhiên

Tác giả: Jennifer Hiller | Ảnh: Rory Doyle cho WSJ
Ngày 30 tháng 3 năm 2025 5:30 sáng ET

HOLLY RIDGE, Louisiana — Các nhà sản xuất đã bỏ qua mảnh đất nông nghiệp này trong gần hai thập kỷ, một chuỗi thất bại đã khiến đây trở thành một trong những góc nghèo nhất của Louisiana.

Một phần tư trong số 20.000 cư dân ở giáo xứ Richland sống trong cảnh nghèo đói. Việc làm nông nghiệp giảm dần khi nông nghiệp trở nên hiệu quả hơn, buộc người dân phải di cư đi nơi khác để làm việc. Hy vọng về một nhà máy sản xuất ô tô sau đó đã phá sản.

Hiện tại, cộng đồng đang hy vọng vào một vị cứu tinh mới: AI.

Meta Platforms META -4,29% (giảm; mũi tên đỏ chỉ xuống) đã mua 2.700 mẫu đất nông nghiệp vào năm ngoái cho trung tâm dữ liệu lớn nhất từ trước đến nay của họ, được xây dựng trên những cánh đồng lúa bằng phẳng cách sông Mississippi 45 phút về phía tây.

Với diện tích 4 triệu foot vuông, tương đương 70 sân bóng đá, trung tâm dữ liệu của Meta sẽ có giá 10 tỷ đô la và chiếm nhiều diện tích hơn Đại học Bang Louisiana ở Baton Rouge, nơi có hơn 34.000 sinh viên.

Việc xây dựng hệ thống trí tuệ nhân tạo tiên tiến sẽ cần lượng điện năng tương đương với một thành phố, điều này đã thúc đẩy dự báo nhu cầu điện lần đầu tiên trong thế kỷ này.

Các công ty công nghệ đang mở rộng vào những khu vực không ngờ tới của đất nước, xa các thị trường trung tâm dữ liệu truyền thống như Bắc Virginia. Họ đang săn tìm những vùng đất bằng phẳng rộng lớn với khả năng tiếp cận khí đốt tự nhiên và đường dây truyền tải, đưa họ đến gần khu vực dầu khí, bao gồm cả Haynesville Shale của Louisiana.

Các kết hợp khác giữa công nghệ và khí đốt tự nhiên đang xuất hiện từ North Dakota đến West Texas, nơi địa điểm đầu tiên cho dự án Stargate — một sáng kiến cơ sở hạ tầng AI mới trị giá 500 tỷ đô la — sẽ có nhà máy điện chạy bằng khí đốt tự nhiên tại chỗ. Exxon Mobil và Chevron cũng đang tham gia vào lĩnh vực kinh doanh điện để cung cấp năng lượng cho AI.

Giám đốc điều hành Meta Mark Zuckerberg đã tự hào về dự án của mình trên Facebook và Instagram. Ông nói địa điểm này sẽ được sử dụng để đào tạo các phiên bản tương lai của Llama, bộ sưu tập các mô hình AI mã nguồn mở của Meta và "lớn đến mức nó sẽ phủ một phần đáng kể của Manhattan". Diện tích mặt bằng mà ông chia sẻ trải dài hơn 5 dặm, phủ bóng một khu vực sẽ trải dài từ Công viên Trung tâm đến SoHo.

Gia đình điều hành một xe bán cà phê.

Jeffrey và Shelbie Stephenson bên trong xe bán thức ăn mới họ mở ngay cạnh trung tâm dữ liệu mới của Meta. Dự kiến sẽ có khoảng 500 việc làm lâu dài tại địa điểm này.

Để đáp ứng nhu cầu điện khổng lồ của dự án và các hoạt động phát triển khác, công ty Entergy của Louisiana dự định chi khoảng 3,2 tỷ đô la để xây dựng ba nhà máy điện chạy bằng khí đốt tự nhiên, khai thác trữ lượng khí đốt khổng lồ của tiểu bang. Nếu được cơ quan quản lý tiểu bang phê duyệt, hai nhà máy sẽ được xây dựng gần địa điểm của Meta, nơi đã có sẵn đường dây truyền tải và đường ống dẫn khí đốt.

Tại Holly Ridge, một cộng đồng chưa hợp nhất với một đèn giao thông nhấp nháy, hàng trăm thiết bị xây dựng đang di chuyển trên gốc rạ còn sót lại từ vụ thu hoạch mùa thu. Cuối cùng 5.000 công nhân xây dựng sẽ đến.

Phần thưởng tài chính — và rủi ro — là rất lớn. Meta sẽ mang lại tiền bạc, việc làm và doanh thu thuế địa phương. Nhưng lo ngại đang gia tăng rằng dự án cũng đe dọa khiến khách hàng sử dụng điện trên khắp Louisiana phải gánh chịu chi phí cao hơn nếu nhu cầu từ gã khổng lồ công nghệ này cuối cùng cạn kiệt.

Một canh bạc lớn

Gregory Upton, giám đốc điều hành tại Trung tâm Nghiên cứu Năng lượng LSU, ước tính Meta có thể sử dụng 15% sản lượng điện hiện tại của Louisiana.

Điều đó đáng lo ngại đối với các khách hàng sử dụng tiện ích khác chủ yếu vì sự không tương xứng giữa tuổi thọ 40 đến 50 năm của các nhà máy điện chạy bằng khí đốt và thỏa thuận 15 năm của Entergy với Meta. Họ không muốn phải gánh vác cơ sở hạ tầng.

"Họ muốn sử dụng tiền của người đóng thuế để tài trợ cho một thứ mà hiện tại họ chỉ thực sự nói là họ muốn trong 15 năm," Logan Atkinson Burke thuộc Liên minh vì Năng lượng giá phải chăng, một nhóm vận động cho khách hàng dân cư, cho biết.

Các công ty công nghiệp, chiếm khoảng một nửa doanh số bán điện của Louisiana, đang bày tỏ mối quan ngại của họ với Mike Francis, một trong năm ủy viên tiện ích Louisiana.

Góc nhìn từ trên cao về đất nông nghiệp gần địa điểm xây dựng trung tâm dữ liệu Meta.

Đất nông nghiệp gần địa điểm xây dựng trung tâm dữ liệu mới của Meta ở Holly Ridge, Louisiana.

"Chúng tôi nghe về điều này liên tục," Francis nói, lưu ý rằng ai đó phải đảm bảo các khoản thanh toán cho các dự án mới trong khoảng 30 năm.

"Đoán xem là ai?" Francis hỏi. "Sẽ là những người đóng tiền điện."

Các ủy viên sẽ xem xét yêu cầu của Entergy vào cuối năm nay, nhưng Francis nói rằng khoản đầu tư của Meta có thể xứng đáng với rủi ro tài sản bị bỏ hoang sau này.

Canh bạc đó đã trở nên nổi bật vào tháng Giêng khi startup Trung Quốc DeepSeek gây bất ngờ cho Thung lũng Silicon với các mô hình AI mạnh mẽ được xây dựng rẻ hơn và sử dụng ít điện năng hơn so với các sản phẩm tương đương của Mỹ. Kể từ đó, các nhà đầu tư đã đặt câu hỏi về chi tiêu cho AI, mặc dù nguồn tiền vẫn tiếp tục chảy cho đến nay.

Entergy nói trong các hồ sơ rằng thỏa thuận với Meta "cố gắng giảm thiểu" tác động đến giá và có thể giảm chi phí cho những người khác.

"Có một số điều mà chúng tôi đang làm việc với Meta để cố gắng quản lý mối quan tâm này," Drew Marsh, Giám đốc điều hành của Entergy cho biết. "Họ cũng muốn trở thành những người hàng xóm tốt, vì vậy họ đang giúp chúng tôi bằng cách về cơ bản là gánh vác các chi phí mà họ đang gây ra."

Thế giới đang thay đổi

Số lượng việc làm lâu dài của Meta — khoảng 500 — ít hơn so với hàng nghìn việc làm có thể đi kèm với một nhà máy ô tô. Tuy nhiên, đối với một giáo xứ có thu nhập hộ gia đình trung bình khoảng 53.000 đô la, tác động dự kiến sẽ có ý nghĩa. Mức lương trung bình tại Meta dự kiến là 82.000 đô la, theo hồ sơ của Entergy.

Jesse Washington, thị trưởng Delhi gần đó, nói ông hy vọng sẽ thấy người dân địa phương được Meta tuyển dụng và xây dựng nhiều nhà ở vĩnh viễn hơn, thay vì những ngôi nhà di động xuất hiện rồi biến mất.

Thị trưởng Delhi Jesse Washington hy vọng sẽ thấy thị trấn gần đó của mình phát triển nhờ khoản đầu tư của Meta.

"Đó là những thứ khiến tôi thức đêm, khi mọi người khác đang ngủ, nghĩ về," Washington nói. "Làm thế nào để thị trấn Delhi phát triển từ Meta?"

Các cuộc thảo luận nội bộ tại Meta về nhu cầu một địa điểm khổng lồ bắt đầu vào cuối năm 2023, khi công ty đã đối mặt với tình trạng thiếu các địa điểm đáp ứng nhu cầu của họ. Dự án Holly Ridge lớn gấp khoảng 10 lần so với một trung tâm dữ liệu điển hình của Meta.

"Tôi cho rằng đây có lẽ là dự án quan trọng nhất mà chúng tôi đã thực hiện," Brad Davis, giám đốc phát triển cộng đồng và kinh tế trung tâm dữ liệu của Meta cho biết.

Để thu hút Meta vào năm ngoái, các nhà lập pháp Louisiana đã phê duyệt miễn thuế bán hàng cho thiết bị trung tâm dữ liệu, một ưu đãi có sẵn ở hầu hết các tiểu bang có thị trường trung tâm dữ liệu lớn. Louisiana cũng cần thêm đất.

Susan Bourgeois, thư ký của Louisiana Economic Development, đã gọi cho Scott Franklin, người mà ông nội đã bán 1.440 mẫu ruộng lúa ở Holly Ridge cho tiểu bang vào năm 2006 khi Louisiana đang theo đuổi các nhà máy ô tô. Bourgeois cho biết một công ty muốn nhiều hơn nữa.

"Cái gì có thể lớn đến thế?" Franklin nhớ lại suy nghĩ của mình. Cuối cùng ông đã bán gần 1.300 mẫu đất trực tiếp cho Meta.

Bourgeois nói từ chối Meta sẽ là điều ngớ ngẩn.

"Thế giới đang thay đổi nhanh hơn bất kỳ ai trong chúng ta có thể dự đoán," Bourgeois nói. "Ngày nay, dường như hơi ngớ ngẩn khi quá sợ hãi quá nhiều điện, rằng chúng ta nghĩ rằng chúng ta sẽ ở một nơi trong 20 năm nữa để nói rằng, 'Ôi không, chúng ta có quyền tiếp cận quá nhiều điện.'"

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-03-29 20:36:56

Tại sao nhà máy AI của bạn cần chiến lược phân đoạn mạng

Khi doanh nghiệp xây dựng các sản phẩm tạo sự khác biệt trên thị trường bằng AI, họ đang bắt đầu xây dựng "nhà máy AI" - những khoản đầu tư cơ sở hạ tầng quy mô lớn với khả năng tính toán hiệu suất cao, lưu trữ chuyên biệt và mạng được thiết kế cho đào tạo và suy luận khối lượng lớn.
Nhà máy AI ngày càng trở nên phức tạp với khả năng lập lịch và cung cấp động các tài nguyên giá trị cao như GPU cho nhiều nhóm và khối lượng công việc khác nhau. Quy mô tiếp nhận dữ liệu và đào tạo mô hình tạo ra lưu lượng đông-tây khổng lồ, trong khi suy luận thường liên quan đến lưu lượng bắc-nam.
Khi trung tâm dữ liệu bắt đầu mở rộng quy mô, các kiến trúc sư mạng nhận ra rằng việc cố gắng chạy dịch vụ trên mạng phẳng hoặc phân đoạn tối thiểu có thể dẫn đến nhiều vấn đề như hiệu suất và không thể thực thi chính sách.
Nhiều người thuê truy cập cùng một GPU hoặc tài nguyên tính toán có thể tạo ra vấn đề cô lập người thuê hoặc thậm chí bão hòa mạng. Việc giới thiệu phân đoạn mạng trong các cụm AI giúp quản lý quyền truy cập lưu lượng, ngăn chặn các vấn đề này.
Khi tất cả lưu lượng xuất phát từ một vài nút cụm, gần như không thể cô lập các mối đe dọa hoặc thực thi quyền truy cập tối thiểu. Ngoài ra, việc xác định nguyên nhân gốc rễ của các vấn đề về hiệu suất hoặc vi phạm bảo mật trở nên cực kỳ khó khăn và làm tăng độ phức tạp trong vận hành.
Phân đoạn mạng giải quyết những vấn đề này bằng cách cô lập hợp lý các khối lượng công việc, luồng dữ liệu và người thuê, mang lại nhiều lợi ích chính: bảo mật, hiệu suất và tuân thủ.
Về bảo mật, phân đoạn mạng giúp các nhóm bảo mật dễ dàng áp dụng chính sách, phát hiện bất thường và ngăn chặn vi phạm. Phương pháp này phù hợp với nguyên tắc zero trust và giảm bề mặt đe dọa.
Về hiệu suất, mạng phân đoạn giúp cân bằng tải lưu lượng và phân bổ tài nguyên hiệu quả hơn, điều quan trọng cho khối lượng công việc AI nơi thời gian đến hiểu biết là quan trọng.
Về tuân thủ, phân đoạn mạng giúp đơn giản hóa việc tuân thủ bằng cách đảm bảo dữ liệu nhạy cảm vẫn ở trong các vùng an toàn, trong khi khối lượng công việc ít nhạy cảm hơn có thể được phân đoạn trong các khu vực bảo mật thấp hơn.
Để tích hợp phân đoạn mạng hiệu quả, việc bảo toàn ngữ cảnh người thuê trên các mạng là điều cần thiết. Doanh nghiệp nên sử dụng các phương pháp như bộ điều phối hoặc proxy mạng chuyên dụng để giữ lại danh tính người thuê khi lưu lượng rời khỏi và quay lại cụm AI.
Việc áp dụng tăng tốc phần cứng như đơn vị xử lý dữ liệu (DPU) hoặc card giao diện mạng chuyên dụng có thể cải thiện hiệu suất và giải phóng tài nguyên tính toán, giúp GPU tập trung vào các tác vụ đào tạo và suy luận.
Đồng thời, việc tận dụng kiểm soát truy cập dựa trên vai trò (RBAC) và chính sách bảo mật tập trung là điều cần thiết. Nhà máy AI của bất kỳ tổ chức nào cần có vai trò được xác định rõ ràng giữa các nhóm mạng, bảo mật và kỹ thuật nền tảng.
Đầu tư vào khả năng quan sát và khắc phục sự cố đảm bảo nỗ lực phân đoạn mang lại ROI tích cực cho doanh nghiệp xây dựng nhà máy AI. Phân đoạn có thể trở nên hiệu quả nhất khi các nhóm giám sát và phản ứng với các vấn đề bảo mật và hiệu suất trong thời gian thực.

📌 Phân đoạn mạng là chiến lược nền tảng cho nhà máy AI hiện đại, giúp cô lập khối lượng công việc, bảo vệ danh tính người thuê và giảm bề mặt đe dọa. Doanh nghiệp áp dụng phương pháp này sẽ khai thác tiềm năng AI mà không ảnh hưởng đến hiệu suất hoặc bảo mật.

https://www.thefastmode.com/expert-opinion/40649-why-your-ai-factory-needs-a-network-segmentation-strategy

Không có file đính kèm.

Nguồn tham khảo

AI PC AI chips-hardware-compute 2025-03-28 07:51:35

Nvidia ra mắt NIM microservices giúp chạy các mô hình AI trên PC có card đồ họa RTX

Nvidia vừa công bố bộ công cụ AI mới có tên NIM microservices, giúp người dùng sở hữu phần cứng RTX dễ dàng chạy các mô hình AI cục bộ trên máy tính.
Người dùng có card đồ họa RTX, bao gồm dòng 50-series mới ra mắt, có thể dễ dàng cài đặt các mô hình AI để hỗ trợ tạo văn bản, hình ảnh và mã nguồn.
Các ứng dụng khác của NIM microservices bao gồm xử lý giọng nói, trích xuất PDF và thị giác máy tính, với mục tiêu đơn giản hóa quy trình sử dụng.
Quá trình sử dụng rất đơn giản: người dùng chỉ cần tải về ứng dụng NIM mong muốn và chạy nó. Ví dụ, để phiên âm bài giảng, chỉ cần tải parakeet; để cải thiện giọng hát trong bản thu âm, tải studiovoice.
Các mô hình AI cục bộ này cũng sẽ hoạt động trên dòng máy tính AI chuyên dụng Nvidia DGX sắp ra mắt.
Lợi thế của việc chạy mô hình cục bộ là tiết kiệm chi phí lâu dài, tránh các hạn chế về số lượng nội dung tạo ra như khi sử dụng ChatGPT hay Gemini.
Dữ liệu được lưu trữ trên thiết bị, tăng cường bảo mật khi xử lý tài liệu nhạy cảm, đồng thời ít bị hạn chế hơn về loại nội dung có thể tạo ra.
Nvidia hiện là một trong những công ty quan trọng nhất trong lĩnh vực AI, với chip của họ hỗ trợ phát triển các mô hình AI mới từ OpenAI, Google và DeepSeek.
Công ty đã đạt mức định giá 3 nghìn tỷ USD vào năm ngoái và hiện đang ở mức 2,8 nghìn tỷ USD.
Xu hướng chạy AI cục bộ đang gia tăng: iPhone 16, Google Pixel 9 có thể tạo hình ảnh, chỉnh sửa ảnh hoặc tóm tắt văn bản mà không cần kết nối đến máy chủ GPU từ xa.
PlayStation 5 Pro sử dụng AI để nâng cao hình ảnh, và Nintendo Switch 2 được đồn đoán sẽ làm tương tự.
Nvidia cũng giới thiệu Project G-Assist, trợ lý AI thử nghiệm trong ứng dụng Nvidia, giúp tối ưu hóa ứng dụng và trò chơi, chạy chẩn đoán thời gian thực và đưa ra khuyến nghị về tối ưu hóa hiệu suất.
G-Assist còn có plugin Google Gemini, cho phép người dùng nhận câu trả lời ngay lập tức về các câu hỏi liên quan đến trò chơi.

📌 Nvidia đang cách mạng hóa AI cá nhân với NIM microservices cho phép người dùng RTX chạy mô hình AI cục bộ, tiết kiệm chi phí và bảo vệ dữ liệu. Với định giá 2,8 nghìn tỷ USD, Nvidia tiếp tục dẫn đầu xu hướng AI trên thiết bị.

https://www.cnet.com/tech/services-and-software/nvidias-new-tools-make-running-ai-on-your-computer-a-breeze/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-03-27 07:18:43

Châu Phi sắp có nhà máy AI đầu tiên: Cassava Technologies đầu tư siêu máy tính Nvidia tại Nam Phi

Cassava Technologies, chủ sở hữu Africa Data Centres, công bố kế hoạch xây dựng nhà máy AI đầu tiên của châu Phi bằng cách nâng cấp các trung tâm dữ liệu với công nghệ điện toán AI của Nvidia, sẽ được triển khai đầu tiên tại Nam Phi.
Công ty có trụ sở tại London này cho biết dự án sẽ giúp các doanh nghiệp, chính phủ và nhà nghiên cứu châu Phi tiếp cận siêu máy tính và phần mềm cần thiết để đào tạo AI.
Công nghệ điện toán và phần mềm AI của Nvidia sẽ được triển khai tại các cơ sở của Africa Data Centre ở Nam Phi trước, sau đó mở rộng đến các trung tâm dữ liệu ở Ai Cập, Kenya, Morocco và Nigeria.
Siêu máy tính trang bị GPU của Nvidia sẽ cho phép đào tạo và tinh chỉnh mô hình AI nhanh hơn.
Cassava dự định cung cấp dịch vụ AI-as-a-Service trên khắp châu lục thông qua mạng cáp quang độ trễ cực thấp, sử dụng sức mạnh tính toán từ các trung tâm dữ liệu hỗ trợ AI.
Strive Masiyiwa, người sáng lập và chủ tịch Cassava Technologies, nhấn mạnh rằng xây dựng cơ sở hạ tầng số cho nền kinh tế AI là ưu tiên để châu Phi tận dụng tối đa cuộc cách mạng công nghiệp lần thứ tư.
Jaap Zuiderveld, Phó chủ tịch EMEA của Nvidia, cho biết AI đang giúp các nhà đổi mới giải quyết những thách thức lớn trong nông nghiệp, y tế, năng lượng, dịch vụ tài chính và nhiều ngành công nghiệp khác.
Cassava tin rằng việc tiếp cận mạng lưới trung tâm dữ liệu sẽ giúp doanh nghiệp và chính phủ châu Phi phát triển giải pháp địa phương cho thách thức địa phương, tuân thủ quy định toàn cầu.
Công ty này, trước đây là Liquid Group, gần đây đã đối mặt với một số vấn đề tài chính đáng kể.
Tháng 12/2023, Cassava thông báo huy động được 90 triệu USD (1,7 tỷ rand), với sự tham gia của Tập đoàn Tài chính Phát triển Quốc tế Hoa Kỳ (DFC), Quỹ Hợp tác Công nghiệp Phần Lan (Finnfund) và Google.
Công ty con Liquid Intelligent Technologies cũng tái cấp vốn khoản vay dài hạn, với Standard Bank, Rand Merchant Bank, Nedbank và International Finance Corporation cung cấp khoản vay mới trị giá 4 tỷ rand.

📌 Cassava Technologies đang xây dựng nhà máy AI đầu tiên của châu Phi tại Nam Phi, trang bị siêu máy tính GPU của Nvidia. Dự án sẽ mở rộng đến Ai Cập, Kenya, Morocco và Nigeria, cung cấp dịch vụ AI-as-a-Service thông qua mạng cáp quang độ trễ thấp, giúp châu Phi phát triển giải pháp công nghệ địa phương và tăng cường độc lập số.

https://mybroadband.co.za/news/cloud-hosting/588193-south-african-data-centre-to-receive-major-ai-upgrades.html

Không có file đính kèm.

Nguồn tham khảo

AI pháp lý-quản trị-chủ quyền AI chips-hardware-compute 2025-03-27 00:47:51

Mỹ thêm hơn 50 công ty Trung Quốc vào danh sách đen xuất khẩu nhằm hạn chế phát triển AI và chip của Bắc Kinh

Bộ Thương mại Mỹ đã thêm 80 tổ chức vào "danh sách thực thể", trong đó hơn 50 tổ chức đến từ Trung Quốc, cấm các công ty Mỹ cung cấp hàng hóa cho những đơn vị này nếu không có giấy phép của chính phủ.
Đây là nỗ lực đầu tiên dưới thời chính quyền Donald Trump nhằm hạn chế khả năng phát triển trí tuệ nhân tạo và điện toán tiên tiến của Bắc Kinh.
Các công ty bị đưa vào danh sách đen vì bị cáo buộc hành động đi ngược lại an ninh quốc gia và lợi ích chính sách đối ngoại của Mỹ.
Hàng chục thực thể Trung Quốc bị nhắm đến vì cáo buộc tham gia phát triển AI tiên tiến, siêu máy tính và chip AI hiệu suất cao cho mục đích quân sự.
Bộ Thương mại cho biết 2 công ty đã cung cấp cho các thực thể bị trừng phạt như Huawei và nhà sản xuất chip liên kết HiSilicon.
Mỹ đã đưa vào danh sách đen 27 thực thể Trung Quốc vì thu mua các mặt hàng có nguồn gốc từ Mỹ để hỗ trợ hiện đại hóa quân đội Trung Quốc.
7 công ty bị nhắm đến vì giúp thúc đẩy khả năng công nghệ lượng tử của Trung Quốc.
Trong số các tổ chức trong "danh sách thực thể" có 6 công ty con của tập đoàn điện toán đám mây Trung Quốc Inspur Group, đã bị chính quyền Joe Biden đưa vào danh sách đen vào năm 2023.
Bộ Ngoại giao Trung Quốc tuyên bố "lên án mạnh mẽ" các hạn chế xuất khẩu này và kêu gọi Mỹ "ngừng khái quát hóa an ninh quốc gia".
Các biện pháp hạn chế xuất khẩu mở rộng diễn ra trong bối cảnh căng thẳng giữa Washington và Bắc Kinh gia tăng, với việc chính quyền Trump tăng thuế đối với Trung Quốc.
Sự phát triển nhanh chóng của startup AI Trung Quốc DeepSeek đã thúc đẩy việc áp dụng các mô hình AI nguồn mở chi phí thấp ở Trung Quốc, gây áp lực lên các đối thủ hàng đầu của Mỹ với các mô hình độc quyền chi phí cao hơn.
Chính quyền Biden đã áp đặt các biện pháp kiểm soát xuất khẩu toàn diện đối với Trung Quốc, bao gồm mọi thứ từ bán dẫn đến siêu máy tính theo chính sách "sân nhỏ, hàng rào cao".

📌 Mỹ đã đưa hơn 50 công ty Trung Quốc vào danh sách đen xuất khẩu, nhắm vào các lĩnh vực AI, điện toán hiệu suất cao và công nghệ lượng tử. Đây là động thái đầu tiên dưới thời Trump nhằm ngăn chặn việc sử dụng công nghệ Mỹ cho mục đích quân sự, trong bối cảnh căng thẳng thương mại Mỹ-Trung leo thang.

https://www.cnbc.com/2025/03/26/us-blacklists-50-chinese-companies-in-bid-to-curb-beijings-ai-chip-capabilities.html

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-03-26 05:28:05

Chủ tịch Alibaba Joe Tsai cảnh báo về bong bóng trong xây dựng trung tâm dữ liệu AI

Chủ tịch Alibaba Joe Tsai cảnh báo về nguy cơ bong bóng trong lĩnh vực xây dựng trung tâm dữ liệu, cho rằng tốc độ phát triển có thể vượt xa nhu cầu thực tế cho dịch vụ AI.
Tsai bày tỏ lo ngại tại hội nghị thượng đỉnh đầu tư toàn cầu HSBC ở Hong Kong rằng nhiều dự án đang được xây dựng mà không có khách hàng cụ thể, và một số dự án đang huy động vốn mà không có thỏa thuận "tiếp nhận" đảm bảo.
Từ Microsoft đến SoftBank, các công ty công nghệ trên toàn cầu đang chi hàng tỷ đô la mua chip của Nvidia và SK Hynix - thiết bị quan trọng cho phát triển AI.
Chính Alibaba cũng đã tuyên bố đầu tư hơn 380 tỷ nhân dân tệ (52 tỷ USD) trong ba năm tới, sau khi công bố chiến lược tập trung vào AI vào tháng 2.
Các trung tâm máy chủ đang mọc lên từ Ấn Độ đến Malaysia, trong khi tại Mỹ, dự án Stargate được tổng thống Trump ủng hộ dự kiến chi tiêu nửa nghìn tỷ đô la.
Cổ phiếu của Alibaba đã giảm hơn 3% tại Hong Kong. Nhiều nhà phân tích Wall Street bắt đầu đặt câu hỏi về mức chi tiêu này, đặc biệt sau khi startup Trung Quốc DeepSeek phát hành mô hình AI nguồn mở với chi phí thấp hơn nhiều nhưng tuyên bố có khả năng cạnh tranh với công nghệ Mỹ.
Các công ty công nghệ Mỹ đang chi tiêu mạnh: Amazon cam kết 100 tỷ USD, Alphabet 75 tỷ USD và Meta lên đến 65 tỷ USD chỉ trong năm nay cho cơ sở hạ tầng AI.
Các nhà phân tích TD Cowen đã chỉ ra dấu hiệu Microsoft hủy một số hợp đồng thuê trung tâm dữ liệu ở Mỹ, làm dấy lên lo ngại về việc họ có thể đang bảo đảm nhiều năng lực tính toán AI hơn mức cần thiết.
Microsoft dự kiến chi 80 tỷ USD trong năm tài chính này cho các trung tâm dữ liệu AI, nhưng tốc độ tăng trưởng chi tiêu sẽ bắt đầu chậm lại vào năm tới.
Tsai bày tỏ sự ngạc nhiên về con số đầu tư được đề cập ở Mỹ, cho rằng mức đầu tư 500 tỷ USD là không cần thiết và các công ty đang đầu tư vượt xa nhu cầu hiện tại.
Alibaba đang phục hồi vào năm 2025 nhờ một phần vào sự phổ biến của nền tảng AI dựa trên Qwen, dự kiến sẽ thúc đẩy hoạt động thương mại cốt lõi và dịch vụ đám mây của công ty.

📌 Chủ tịch Alibaba Joe Tsai cảnh báo về bong bóng đầu tư 500 tỷ USD vào trung tâm dữ liệu AI, khi nhiều dự án được xây dựng không có khách hàng rõ ràng. Các gã khổng lồ công nghệ Mỹ như Amazon (100 tỷ USD), Alphabet (75 tỷ USD) và Meta (65 tỷ USD) đang chi tiêu vượt xa nhu cầu thực tế.

https://www.bloomberg.com/news/articles/2025-03-25/alibaba-s-tsai-warns-of-a-bubble-in-ai-datacenter-buildout

Alibaba Tsai Cảnh báo về 'Bong bóng' trong Xây dựng Trung tâm dữ liệu AI

Bởi Luz Ding
Ngày 25 tháng 3 năm 2025 lúc 2:05 sáng UTC

Chủ tịch Alibaba Group Holding Ltd. Joe Tsai cảnh báo về khả năng hình thành bong bóng trong xây dựng trung tâm dữ liệu, lập luận rằng tốc độ xây dựng có thể vượt quá nhu cầu ban đầu đối với dịch vụ AI.
Tóm tắt bởi Bloomberg AI
Tsai bày tỏ lo ngại rằng nhiều dự án trung tâm dữ liệu đang được xây dựng mà không có khách hàng rõ ràng trong tâm trí, và một số dự án đang huy động vốn mà không có thỏa thuận "tiếp nhận" được đảm bảo.
Tóm tắt bởi Bloomberg AI
Tsai chỉ trích các công ty công nghệ Mỹ, bao gồm Amazon, Alphabet và Meta, về việc chi tiêu khổng lồ cho cơ sở hạ tầng AI, gợi ý rằng điều này có thể không cần thiết và vượt quá nhu cầu hiện tại.

Chủ tịch Alibaba Group Holding Ltd. Joe Tsai đã cảnh báo về khả năng hình thành bong bóng trong xây dựng trung tâm dữ liệu, lập luận rằng tốc độ xây dựng đó có thể vượt quá nhu cầu ban đầu đối với dịch vụ AI.
Sự vội vã của các công ty công nghệ lớn, quỹ đầu tư và các tổ chức khác để dựng các cơ sở máy chủ từ Mỹ đến châu Á đang bắt đầu trông có vẻ thiếu chọn lọc, vị tỷ phú điều hành và nhà tài chính cho biết. Nhiều dự án trong số đó được xây dựng mà không có khách hàng rõ ràng trong tâm trí, Tsai nói với Hội nghị thượng đỉnh đầu tư toàn cầu HSBC tại Hồng Kông vào thứ Ba.
Từ Microsoft Corp. đến SoftBank Group Corp., các công ty công nghệ ở cả hai bờ Thái Bình Dương đang chi hàng tỷ đô la mua chip Nvidia Corp. và SK Hynix Inc. quan trọng cho sự phát triển AI. Bản thân Alibaba — công ty vào tháng 2 đã tuyên bố sẽ đi theo hướng AI — dự định đầu tư hơn 380 tỷ nhân dân tệ (52 tỷ USD) trong ba năm tới. Các trang trại máy chủ đang mọc lên từ Ấn Độ đến Malaysia, trong khi ở Mỹ, Tổng thống Donald Trump đang ca ngợi dự án Stargate với khoản chi tiêu dự kiến là nửa nghìn tỷ đô la.
Cổ phiếu của Alibaba đã giảm hơn 3% tại Hồng Kông. Nhiều người ở Phố Wall đã bắt đầu đặt câu hỏi về chi tiêu đó, đặc biệt là sau khi công ty mới nổi DeepSeek của Trung Quốc đã phát hành một mô hình AI nguồn mở mà công ty này tuyên bố có thể sánh với công nghệ Mỹ nhưng được xây dựng với chi phí thấp hơn nhiều. Giới phê bình cũng đã chỉ ra sự thiếu hụt dai dẳng các ứng dụng thực tế, trong thế giới thực cho AI.
Đọc thêm: DeepSeek của Trung Quốc tiết lộ bản cập nhật mới nhất trong cuộc đua với OpenAI
XEM: DeepSeek của Trung Quốc đến với AI lớn như thế nào.
"Tôi bắt đầu thấy khởi đầu của một loại bong bóng nào đó," Tsai nói với các đại biểu. Một số dự án được dự kiến đã bắt đầu huy động vốn mà không có thỏa thuận "tiếp nhận" được đảm bảo, ông bổ sung. "Tôi bắt đầu lo lắng khi mọi người đang xây dựng trung tâm dữ liệu theo đặc điểm kỹ thuật. Có một số người đang xuất hiện, các quỹ đang ra đời, để huy động hàng tỷ hoặc hàng triệu vốn."

Alibaba đang thực hiện một sự trở lại vào năm 2025 một phần nhờ vào sự phổ biến gần đây của nền tảng AI dựa trên Qwen, mà công ty dự kiến sẽ thúc đẩy hoạt động kinh doanh thương mại cốt lõi của Alibaba cũng như dịch vụ đám mây. Tại hội nghị thượng đỉnh, Tsai đã nói về việc Alibaba đang trải qua một cuộc "khởi động lại" và tuyển dụng lại sau nhiều năm giám sát quy định đã hạn chế tăng trưởng. Công ty đã khởi xướng các chương trình để thu hút nhân tài AI mà công ty cần để thúc đẩy tham vọng đã tuyên bố về việc khám phá trí tuệ nhân tạo tổng quát.
Đồng thời, Tsai có những lời bình luận chọn lọc về các đối thủ Mỹ của mình, đặc biệt là về chi tiêu của họ.
Chỉ trong năm nay, Amazon.com Inc., Alphabet Inc. và Meta Platforms Inc. đã cam kết chi 100 tỷ USD, 75 tỷ USD và lên đến 65 tỷ USD, tương ứng, cho cơ sở hạ tầng AI.
Nhưng vào tháng 2, các nhà phân tích TD Cowen đã trích dẫn dấu hiệu cho thấy Microsoft đã hủy một số hợp đồng thuê cho năng lực trung tâm dữ liệu ở Mỹ, làm dấy lên lo ngại về việc liệu công ty này có đang bảo đảm nhiều năng lực điện toán AI hơn nhu cầu trong dài hạn hay không.
Các giám đốc điều hành của công ty đã giảm nhẹ những lo ngại đó, nói rằng Microsoft đang chi tiêu nhiều hơn bao giờ hết trong lịch sử của mình, khoản chi chủ yếu dành cho chip và trung tâm dữ liệu. Công ty Mỹ cho biết dự kiến sẽ chi 80 tỷ USD trong năm tài chính này cho các trung tâm dữ liệu AI, nhưng tốc độ tăng trưởng chi tiêu đó nên bắt đầu chậm lại trong năm bắt đầu từ tháng 7.
"Tôi vẫn kinh ngạc về loại con số đang được đưa ra ở Mỹ về đầu tư vào AI," Tsai nói với khán giả.
"Mọi người đang nói, thực sự đang nói về 500 tỷ USD, vài trăm tỷ đô la. Tôi không nghĩ rằng điều đó hoàn toàn cần thiết. Tôi nghĩ theo một cách nào đó, mọi người đang đầu tư trước nhu cầu mà họ đang thấy ngày nay, nhưng họ đang dự báo nhu cầu lớn hơn nhiều."

Alibaba’s Tsai Warns of ‘Bubble’ in AI Data Center Buildout

By Luz Ding March 25, 2025 at 2:05 AM UTC Updated on March 25, 2025 at 8:30 AM UTC

Chairman Joe Tsai warns of a potential bubble forming in data center construction, arguing that the pace of buildout may outstrip initial demand for AI services. Summary by Bloomberg AI Tsai expresses concern that many data center projects are being built without clear customers in mind, and that some projects are raising funds without secured "uptake" agreements. Summary by Bloomberg AI Tsai criticizes US tech firms, including Amazon, Alphabet, and Meta, for their massive spending on AI infrastructure, suggesting that it may be unnecessary and ahead of current demand. Summary by Bloomberg AI Watch 7:28 New AI Tools to Protect Kids Online More Like This Technology Tencent-Backed Kuaishou Pledges AI Efforts as Sales Growth Slows Markets Xiaomi, BYD’s $11 Billion in Share Sales Show Hong Kong Deals Roar Back Alibaba Group Holding Ltd. Chairman Joe Tsai warned of a potential bubble forming in data center construction, arguing that the pace of that buildout may outstrip initial demand for AI services. A rush by big tech firms, investment funds and other entities to erect server bases from the US to Asia is starting to look indiscriminate, the billionaire executive and financier said. Many of those projects are built without clear customers in mind, Tsai told the HSBC Global Investment Summit in Hong Kong Tuesday. From Microsoft Corp. to SoftBank Group Corp., tech firms on both sides of the Pacific are spending billions of dollars buying the Nvidia Corp. and SK Hynix Inc. chips crucial to AI development. Alibaba itself — which in February declared it was going all-in on AI — plans to invest more than 380 billion yuan ($52 billion) over the next three years. Server farms are springing up from India to Malaysia, while in the US, President Donald Trump is touting a Stargate project that envisions an outlay of half-a-trillion dollars. Alibaba’s shares slid more than 3% in Hong Kong. Many on Wall Street have begun to question that spending, especially after Chinese upstart DeepSeek released an open-source AI model that it claims rivals US technology but was built at a fraction of the cost. Critics have also pointed out the persistent dearth of practical, real-world applications for AI. Read More: China’s DeepSeek Unveils Latest Update in Race With OpenAI WATCH: How China’s DeepSeek came for big AI. “I start to see the beginning of some kind of bubble,” Tsai told delegates. Some of the envisioned projects commenced raising funds without having secured “uptake” agreements, he added. “I start to get worried when people are building data centers on spec. There are a number of people coming up, funds coming out, to raise billions or millions of capital.”

Alibaba is mounting a comeback in 2025 thanks in part to the recent popularity of its Qwen-based AI platform, which it envisions boosting Alibaba’s core commerce business as well as cloud services. At the summit, Tsai talked about how Alibaba was undergoing a “reboot” and rehiring after years of regulatory scrutiny that crimped growth. It’s initiated programs to acquire the AI talent it needs to further its stated ambition of exploring artificial general intelligence. At the same time, Tsai had choice words for his US rivals, particularly with their spending. Just this year, Amazon.com Inc., Alphabet Inc. and Meta Platforms Inc. pledged to spend $100 billion, $75 billion and up to $65 billion, respectively, on AI infrastructure. But in February, TD Cowen analysts cited signs that Microsoft has canceled some leases for US data center capacity, raising concerns over whether it’s securing more AI computing capacity than it needs in the long term. Its executives have played down those concerns, saying Microsoft is spending more than it ever has in its history, outlays that mostly go toward chips and data centers. The US company has said it expects to spend $80 billion this fiscal year on AI data centers, but that pace of spending growth should begin to slow in the year starting July. “I’m still astounded by the type of numbers that’s being thrown around in the United States about investing into AI,” Tsai told the audience. “People are talking, literally talking about $500 billion, several 100 billion dollars. I don’t think that’s entirely necessary. I think in a way, people are investing ahead of the demand that they’re seeing today, but they are projecting much bigger demand.”

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-03-25 22:38:16

Xu hướng và thách thức trong đo kiểm cơ sở hạ tầng AI năm 2025

Tổng số vốn đầu tư vào cơ sở hạ tầng AI năm 2025:
- 4 công ty hàng đầu về cơ sở hạ tầng AI (Amazon, Alphabet, Meta, Microsoft) dự kiến chi tổng cộng 315 tỷ USD vào năm 2025 cho cơ sở hạ tầng AI.
- Amazon: 100 tỷ USD; Alphabet: 75 tỷ USD; Meta: 60-65 tỷ USD; Microsoft: 80 tỷ USD.
- Sáng kiến "Stargate" của OpenAI, Softbank và Oracle cam kết đầu tư 500 tỷ USD cho cơ sở hạ tầng AI trong vòng 5 năm.
Tăng trưởng thị trường cơ sở hạ tầng AI:
- IDC dự đoán chi tiêu cho cơ sở hạ tầng AI sẽ vượt 200 tỷ USD vào năm 2028.
- Trong nửa đầu năm 2024, chi tiêu cho phần cứng tính toán và lưu trữ cho triển khai AI tăng 97% so với cùng kỳ, đạt 47,4 tỷ USD.
- Máy chủ chiếm 95% tổng chi tiêu cơ sở hạ tầng AI, trong đó máy chủ có bộ tăng tốc AI tăng trưởng 178%.
- Dự kiến máy chủ AI sẽ chiếm hơn 75% chi tiêu cho cơ sở hạ tầng máy chủ vào năm 2028.
- Mỹ dẫn đầu thị trường toàn cầu, chiếm gần 60% tổng chi tiêu cho cơ sở hạ tầng AI trong nửa đầu năm 2024.
Hai xu hướng lớn trong đo kiểm cơ sở hạ tầng AI:
- 1. Tích hợp AI vào các thiết bị mạng:
  - AI được sử dụng trong cấu hình chính sách động, cân bằng tải, tối ưu hóa năng lượng và di động.
  - Việc thử nghiệm cần xác định hiệu quả của AI và đảm bảo nó mang lại lợi ích thực sự.
- 2. Mạng được xây dựng để hỗ trợ AI:
  - Trung tâm dữ liệu thay đổi kiến trúc để hỗ trợ các cụm GPU lớn.
  - Lưu lượng AI ngày càng tăng làm thay đổi hành vi và yêu cầu hiệu suất của mạng.
  - ChatGPT đạt 400 triệu người dùng hoạt động hàng tuần vào năm 2024, làm tăng nhu cầu về hạ tầng hỗ trợ.
3 công nghệ hỗ trợ đo kiểm AI:
- Digital twins: Mô phỏng mạng để thử nghiệm các tình huống thực tế mà không tốn chi phí cho phần cứng thực.
- Synthetic test data: Dữ liệu mô phỏng được sử dụng để huấn luyện AI và kiểm tra hệ thống.
- Kiểm tra liên tục và chủ động: Kiểm tra không chỉ trong phòng thí nghiệm mà cả trong môi trường thực tế.
Yêu cầu kiểm tra tại trung tâm dữ liệu:
- Kiểm tra cáp quang: Các vấn đề phổ biến nhất gồm:
  - Đầu cáp quang bị nhiễm bẩn hoặc trầy xước.
  - Cáp bị uốn cong quá bán kính tối thiểu, gây mất tín hiệu.
- Quy trình kiểm tra:
  - Kiểm tra mất tín hiệu.
  - Kiểm tra OTDR để xác định suy hao và phản xạ ngược.
  - Kiểm tra đầu cáp bằng kính hiển vi.
  - Đo chiều dài cáp và xác minh tính phân cực.
Các tiêu chuẩn quốc tế cho đo kiểm cáp quang:
- IEC 61280 và TIA-568.3 là các tiêu chuẩn chính cho thiết kế và kiểm tra cáp quang.
- TIA FOTC đang hợp tác với IEEE P802.3dj để tăng tốc độ Ethernet lên 1,6 Tbps vào năm 2026.
Kiểm tra hiệu suất và bảo đảm:
- Kiểm tra mạng để duy trì hiệu suất băng thông cao, độ trễ thấp và tính nhất quán.
- Tối ưu hóa hiệu suất tại các cụm GPU từ xa và duy trì kết nối không mất gói tin.
- Tận dụng tài nguyên GPU hiệu quả – hiện tại hơn 50% GPU không được sử dụng.
Xu hướng cáp quang và nhu cầu thử nghiệm AI:
- Năm 2024, các công ty lắp đặt hơn 10,3 triệu địa điểm cáp quang.
- Zayo dự định xây dựng hơn 5.000 dặm tuyến cáp quang dài để hỗ trợ nhu cầu của AI.
- Các tuyến cáp quang đang được thiết kế lại để hỗ trợ tốc độ truyền tải lên đến 1,6 Tbps.
- Microsoft có kế hoạch triển khai thêm 15.000 km cáp quang lõi rỗng (HCF) trong vòng 24 tháng.
Các công ty và tổ chức dẫn đầu:
- Spirent Communications: Chuyên cung cấp giải pháp kiểm tra và đảm bảo hiệu suất mạng AI.
- Viavi Solutions: Dẫn đầu trong công nghệ quản lý ánh sáng và giải pháp kiểm tra mạng cho AI.
- Microsoft: Đầu tư mạnh vào cáp quang lõi rỗng để tăng tốc độ và giảm độ trễ cho mạng AI.
- Zayo: Tập trung vào mở rộng mạng cáp quang để đáp ứng nhu cầu AI trong tương lai.

📌 Các khoản đầu tư vào cơ sở hạ tầng AI dự kiến đạt 315 tỷ USD trong năm 2025, với các công ty lớn như Amazon, Alphabet, Meta và Microsoft dẫn đầu. IDC dự đoán chi tiêu cho cơ sở hạ tầng AI sẽ vượt 200 tỷ USD vào năm 2028, với máy chủ AI chiếm hơn 75% chi tiêu. Việc kiểm tra mạng AI bao gồm tích hợp AI vào thiết bị mạng và xây dựng mạng hỗ trợ AI, cùng với các công nghệ như digital twins và dữ liệu thử nghiệm tổng hợp. Các thử nghiệm cáp quang và cơ sở hạ tầng sẽ cần đáp ứng tốc độ lên đến 1,6 Tbps để đảm bảo hiệu suất AI tối ưu.

https://content.rcrwireless.com/how-to-test-and-assure-telco-ai-infrastructure-report

Không có file đính kèm.

Nguồn tham khảo

Semi-Cloud-DC-Green AI chips-hardware-compute 2025-03-24 23:36:23

Khủng hoảng băng thông: AI buộc mạng trung tâm dữ liệu phải tăng gấp 6 lần trong 5 năm tới

Một khảo sát toàn cầu mới do Ciena Corporation thực hiện với hơn 1.300 người ra quyết định về trung tâm dữ liệu từ 13 quốc gia cho thấy AI đang làm thay đổi cơ sở hạ tầng mạng trung tâm dữ liệu với quy mô chưa từng có.
Theo khảo sát, 43% cơ sở trung tâm dữ liệu mới dự kiến sẽ được dành riêng cho các khối lượng công việc AI.
Các chuyên gia trung tâm dữ liệu dự đoán nhu cầu băng thông kết nối trung tâm dữ liệu (DCI) sẽ tăng ít nhất 6 lần trong 5 năm tới.
53% người tham gia tin rằng khối lượng công việc AI sẽ tạo ra nhu cầu lớn nhất đối với cơ sở hạ tầng DCI trong hai đến ba năm tới.
87% người tham gia dự đoán sẽ cần dung lượng 800 Gb/giây hoặc cao hơn trên mỗi bước sóng cho cáp quang.
98% xem quang học cắm được (pluggable optics) là công nghệ quan trọng để giảm tiêu thụ điện năng và diện tích vật lý.
Jürgen Hatheier, giám đốc công nghệ quốc tế tại Ciena, cho biết tốc độ tăng trưởng hàng năm của lưu lượng mạng băng thông rộng thường ở mức 20-30%, nhưng khảo sát cho thấy tỷ lệ này có thể tăng gấp đôi do các ứng dụng AI.
Công ty phân tích Dell'Oro cũng báo cáo sự gia tăng kỷ lục trong doanh số bán thiết bị mạng, chủ yếu do nhu cầu AI. Sameh Boujelbene từ Dell'Oro cho biết hơn 90% mức tăng doanh số bán switch trung tâm dữ liệu trong năm 2024 là do việc xây dựng AI.
Ngoài băng thông, AI cũng đòi hỏi các yêu cầu mạng mới, các loại lưu lượng đa dạng và mô hình lưu lượng động không thể giải quyết chỉ bằng cách thêm phần cứng.
Hatheier nhấn mạnh tầm quan trọng của mạng thông minh có khả năng thích ứng động với các yêu cầu cụ thể, cùng với nền tảng tự động hóa thông minh và chia lát mạng (network slicing) để tối ưu hóa hiệu suất cho các ứng dụng AI.
Công nghệ chia lát mạng cho phép tạo ra các mạng ảo tùy chỉnh phù hợp với yêu cầu cụ thể của ứng dụng AI, tối ưu hóa các thông số như độ trễ, thông lượng và bảo mật.

📌 AI đang thay đổi hoàn toàn mạng trung tâm dữ liệu với 43% cơ sở mới dành cho AI, nhu cầu băng thông tăng gấp 6 lần trong 5 năm tới, và 98% chuyên gia ủng hộ quang học cắm được để giảm tiêu thụ năng lượng. Giải pháp tương lai đòi hỏi tự động hóa thông minh và chia lát mạng.

https://www.datacenterknowledge.com/networking/data-center-networking-needs-are-changing-thanks-to-ai-report

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-03-23 09:58:19

Jensen Huang: AI DeepSeek R1 cần nhiều năng lực tính toán hơn 100 lần so với AI thông thường

Trong cuộc phỏng vấn với Jim Cramer của CNBC tại hội nghị thường niên GTC của Nvidia, CEO Jensen Huang đã thảo luận về tác động của mô hình AI DeepSeek R1 từ startup Trung Quốc.
Huang nhận định mô hình DeepSeek R1 "tuyệt vời" vì đây là "mô hình lập luận nguồn mở đầu tiên", có khả năng phân tích vấn đề từng bước, đưa ra nhiều phương án giải pháp và tự xác minh tính chính xác của câu trả lời.
Trái với nhận định ban đầu của nhiều người trong ngành, Huang khẳng định: "AI lập luận này tiêu thụ năng lực tính toán nhiều hơn 100 lần so với AI không có khả năng lập luận."
Vào cuối tháng 1, thông tin về mô hình DeepSeek đã gây ra đợt bán tháo cổ phiếu AI lớn, khi nhà đầu tư lo ngại mô hình này có thể hoạt động tốt như các đối thủ hàng đầu nhưng tiêu thụ ít năng lượng và chi phí hơn.
Cổ phiếu Nvidia đã giảm 17% trong một phiên, làm mất gần 600 tỷ USD giá trị vốn hóa, mức giảm lớn nhất trong một ngày của bất kỳ công ty Mỹ nào.
Tại hội nghị GTC, Nvidia đã công bố hạ tầng AI mới cho robot và doanh nghiệp, đồng thời nhấn mạnh các quan hệ đối tác với Dell, HPE, Accenture, ServiceNow và CrowdStrike.
Huang nhận xét xu hướng AI đã chuyển từ AI tạo sinh thuần túy sang các mô hình lập luận.
CEO Nvidia dự đoán chi tiêu vốn cho điện toán toàn cầu có thể đạt 1 nghìn tỷ USD vào cuối thập kỷ này, với phần lớn dành cho AI.
"Cơ hội của chúng tôi tính theo tỷ lệ phần trăm của 1 nghìn tỷ USD vào cuối thập kỷ này là khá lớn," Huang nói. "Chúng tôi còn nhiều hạ tầng phải xây dựng."

📌 Mô hình lập luận DeepSeek R1 tiêu thụ năng lực tính toán gấp 100 lần so với AI thông thường, trái với nhận định ban đầu của thị trường. Nvidia dự báo chi tiêu cho điện toán toàn cầu sẽ đạt 1 nghìn tỷ USD vào cuối thập kỷ, mở ra cơ hội lớn cho công ty.

https://www.cnbc.com/2025/03/19/nvidia-ceo-jensen-huang-why-deepseek-model-needs-100-times-more-computing.html

Không có file đính kèm.

Nguồn tham khảo

180

Semi-Cloud-DC-Green AI chips-hardware-compute 2025-03-22 10:17:05

Cơn khát không đáy của AI: Các trung tâm dữ liệu có thể tiêu thụ tới 6,6 tỷ mét khối nước vào năm 2027

Nhu cầu bùng nổ về công nghệ AI, đặc biệt là AI tạo sinh, đang gây áp lực ngày càng lớn lên nguồn cung cấp nước để làm mát cơ sở hạ tầng CNTT.
Tại Virginia (Mỹ), các nhà lập pháp đã đề xuất dự luật yêu cầu các trung tâm dữ liệu phải cung cấp ước tính về lượng nước sử dụng trong quá trình xây dựng. Virginia hiện là nơi tập trung các trung tâm dữ liệu lớn nhất thế giới của Amazon, Google và Microsoft.
Theo Shaolei Ren, phó giáo sư tại Đại học California Riverside, nhu cầu xử lý AI toàn cầu sẽ tiêu thụ 4,2-6,6 tỷ mét khối nước từ nguồn nước ngầm hoặc bề mặt vào năm 2027.
Lo ngại về việc sử dụng nước gia tăng khi điều kiện hạn hán ảnh hưởng đến Virginia và các khu vực khác của Mỹ trong năm 2024. Gần như mọi bang của Mỹ đều trải qua tình trạng khô hạn bất thường.
Equinix, một nhà điều hành trung tâm dữ liệu lớn của Mỹ, cho biết lượng nước sử dụng của họ trong năm 2023 tương đương với một thị trấn nhỏ của Mỹ. Khoảng 60% lượng nước đó bị bay hơi và 40% đi vào hệ thống nước thải địa phương.
Các kỹ thuật làm mát tại Equinix bao gồm giữ nhiều nước hơn trong vòng lặp kín. Chuyển từ làm mát bằng bay hơi truyền thống sang làm mát vòng kín sẽ giảm đáng kể nhu cầu sử dụng nước.
Trung tâm dữ liệu xử lý khối lượng công việc AI tiêu thụ điện năng gấp 6-10 lần so với trung tâm dữ liệu thông thường có cùng kích thước.
Tháng 8/2024, Microsoft công bố thiết kế mới cho trung tâm dữ liệu không làm mất nước do bay hơi khi sử dụng để làm mát, tiết kiệm hơn 125 triệu lít nước mỗi năm cho mỗi cơ sở.
Christelle Khalaf từ Đại học Illinois cho rằng chỉ dựa vào đổi mới để giải quyết thách thức này là không đủ, ít nhất là trong ngắn hạn. Điều đó có nghĩa là chính phủ cần can thiệp với các quy định và hướng dẫn để định hướng các trung tâm dữ liệu mới đến những nơi có nguồn nước dồi dào hơn.
Một số nhà điều hành trung tâm dữ liệu đã tìm kiếm địa điểm có nguồn cung cấp nước đáng tin cậy hơn. Ví dụ, một trung tâm dữ liệu của Equinix ở Toronto lấy nước lạnh từ sâu trong hồ Ontario, giúp giảm một nửa nhu cầu năng lượng mà không làm tăng lượng nước tiêu thụ.

📌 Các trung tâm dữ liệu đang đối mặt với áp lực pháp lý và xã hội để giảm tiêu thụ nước. Dự báo cho thấy AI sẽ cần 4,2-6,6 tỷ mét khối nước vào năm 2027, thúc đẩy các công ty như Microsoft và Equinix phát triển công nghệ làm mát tiết kiệm nước và tìm kiếm địa điểm có nguồn nước dồi dào hơn.

#FT

https://www.ft.com/content/65fff689-bd47-4c15-bdb8-083e5ccd84dc

Big Tech chịu áp lực phải hành động trước cơn khát nước của các trung tâm dữ liệu
Những lời kêu gọi xem xét lại việc sử dụng một nguồn tài nguyên khan hiếm để làm mát các cơ sở quá nóng đang gia tăng ở Mỹ

Một hệ thống làm mát bằng chất lỏng đang được lắp đặt trên một dãy tủ trung tâm dữ liệu của Equinix © Behnam Barghabany

Patrick Temple-West

Nhu cầu bùng nổ đối với các công cụ trí tuệ nhân tạo (AI), được thúc đẩy nhanh chóng bởi sự phát triển của AI tạo sinh, đang gây áp lực ngày càng lớn lên nguồn cung cấp nước để làm mát cơ sở hạ tầng công nghệ thông tin hỗ trợ cho công nghệ này. Hiện nay, các công ty vận hành những trung tâm dữ liệu này đang đối mặt với các lời kêu gọi phải làm cho các cơ sở hoạt động hiệu quả hơn và phải chịu sự giám sát chặt chẽ hơn.

Tại Mỹ, các nhà lập pháp bang Virginia đã thông qua một dự luật nhằm giải quyết vấn đề sử dụng nước của các trung tâm dữ liệu. Dự luật này sẽ cho phép các chính quyền địa phương yêu cầu các trung tâm dữ liệu phải nộp ước tính về mức sử dụng nước như một phần của các yêu cầu xây dựng. Virginia hiện là nơi có một trong những cụm trung tâm dữ liệu lớn nhất thế giới, phục vụ cho các công ty như Amazon, Google và Microsoft.

Dự luật này, hiện đang chờ được phê duyệt hoặc bị phủ quyết bởi Thống đốc Glenn Youngkin, phản ánh mối lo ngại của cử tri về việc các trung tâm dữ liệu làm cạn kiệt nguồn nước địa phương. Mạng lưới Bảo tồn Virginia (Virginia Conservation Network), một tổ chức phi lợi nhuận về môi trường, lập luận vào tháng 2 rằng bang Virginia hiện không có sự giám sát pháp lý nào đối với việc phát triển trung tâm dữ liệu và cho rằng bang nên thu thập thêm thông tin về việc sử dụng nước của các trung tâm này để có thể lên kế hoạch tốt hơn.

“Các trung tâm dữ liệu của một công ty công nghệ lớn có thể tiêu thụ hàng tỷ lít nước mỗi năm, trong một số trường hợp tương đương với lượng nước tiêu thụ của các công ty đồ uống lớn,” Shaolei Ren, phó giáo sư về kỹ thuật điện và máy tính tại Đại học California Riverside, cho biết. Ông ước tính rằng nhu cầu xử lý AI trên toàn cầu sẽ tiêu thụ từ 4,2 tỷ đến 6,6 tỷ mét khối nước được lấy từ các nguồn nước ngầm hoặc nước mặt vào năm 2027.

4,2 tỷ – 6,6 tỷ mét khối
Ước tính lượng nước cần thiết trên toàn cầu cho xử lý AI vào năm 2027

Sự lo ngại của công chúng về việc ai đang sử dụng nước và cho mục đích gì đã gia tăng kể từ khi tình trạng hạn hán ảnh hưởng đến Virginia và các khu vực khác của Mỹ vào năm 2024. Theo Cơ quan Quản lý Khí quyển và Đại dương Quốc gia (NOAA), cơ quan khí hậu của Mỹ, gần như tất cả các bang của Mỹ đều trải qua tình trạng khô hạn bất thường.

Những đợt hạn hán kéo dài và nghiêm trọng hơn ở Mỹ đặt ra nguy cơ gián đoạn hoạt động cho các trung tâm dữ liệu, theo một báo cáo của ngân hàng đầu tư Jefferies vào năm ngoái.

Việc ban hành luật, hoặc nguy cơ phải tuân theo luật, cùng với mối quan tâm của công chúng về việc sử dụng nước đã khiến một số công ty phải hành động. Tại Equinix, một công ty vận hành trung tâm dữ liệu lớn của Mỹ, tình trạng sẵn có của nguồn nước đã được cân nhắc khi quyết định vị trí xây dựng các cơ sở.

Công ty cho biết lượng nước tiêu thụ của các trung tâm dữ liệu trong năm 2023 tương đương với lượng nước mà một thị trấn nhỏ của Mỹ tiêu thụ hàng năm. Khoảng 60% lượng nước đó bốc hơi và 40% được đưa vào hệ thống xử lý nước thải địa phương.

“Chúng tôi liên tục theo dõi những gì đang diễn ra từ góc độ quy định,” Christopher Wellise, phó chủ tịch phụ trách phát triển bền vững tại Equinix, cho biết. Các kỹ thuật làm mát tại các cơ sở của công ty bao gồm giữ nhiều nước hơn trong hệ thống vòng kín.

“Nếu chuyển từ hệ thống làm mát bay hơi truyền thống sang hệ thống làm mát vòng kín, nhu cầu sử dụng nước sẽ giảm đáng kể,” ông giải thích. Làm mát bay hơi là phương pháp dẫn nước lạnh qua các vật liệu quá nóng và thải hơi nước vào không khí. Tuy nhiên, trong hệ thống vòng kín, nước được giữ lại trong cấu trúc để tái sử dụng.

Sự gia tăng của AI đã làm gia tăng các lời kêu gọi hành động. Các trung tâm dữ liệu xử lý khối lượng công việc AI thực hiện các tác vụ xử lý dữ liệu phức tạp hơn và cần lượng điện năng cao hơn từ 6 đến 10 lần so với các trung tâm dữ liệu thông thường có cùng quy mô, theo Noman Bashir, một chuyên gia về điện toán và tác động khí hậu tại Liên minh Khí hậu và Bền vững của Viện Công nghệ Massachusetts (MIT), một liên minh giữa ngành công nghiệp và học thuật.

Ông cũng lưu ý rằng các nỗ lực sử dụng các hỗn hợp làm mát thay thế nước đang dần bị loại bỏ vì các chất lỏng được sử dụng “được phát hiện là rất độc hại” — điều này có nghĩa là phải quay trở lại sử dụng nước.

Vào tháng 8/2024, Microsoft đã công bố một thiết kế trung tâm dữ liệu mới, trong đó không làm mất nước do bay hơi khi làm mát. Công ty công nghệ này cho biết có thể tiết kiệm hơn 125 triệu lít nước mỗi năm cho mỗi cơ sở.

"Ngay cả các trung tâm dữ liệu có mức sử dụng nước trung bình tương đối thấp cũng có thể gây căng thẳng cho cơ sở hạ tầng địa phương."
— Shaolei Ren, UC Riverside

Việc tìm kiếm các công nghệ tiết kiệm nước có thể đang được thực hiện, nhưng “chỉ dựa vào đổi mới để giải quyết thách thức này không nhất thiết là đủ, ít nhất là trong ngắn hạn,” Christelle Khalaf, phó giám đốc trung tâm nghiên cứu tài chính chính phủ tại Đại học Illinois ở Chicago, cho biết. Điều đó có nghĩa là các chính phủ cần phải can thiệp, bà lập luận, bằng cách đưa ra các quy định và hướng dẫn về địa điểm xây dựng để hướng dẫn các trung tâm dữ liệu mới đến những khu vực có nguồn nước dồi dào hơn.

“Khi có nhiều cơ sở hơn được xây dựng, nguy cơ cạnh tranh với cộng đồng, nông nghiệp và công nghiệp để giành lấy các nguồn tài nguyên nước có hạn sẽ gia tăng,” Ren của UC Riverside cho biết. “Ngay cả các trung tâm dữ liệu có mức sử dụng nước trung bình tương đối thấp cũng có thể gây căng thẳng cho cơ sở hạ tầng địa phương do nhu cầu nước đỉnh điểm của chúng.”

Một số nhà khai thác trung tâm dữ liệu hiện đang tìm kiếm các địa điểm có nguồn nước ổn định hơn. Một trung tâm dữ liệu của Equinix ở Toronto, chẳng hạn, lấy nước lạnh từ độ sâu trong hồ Ontario, giúp giảm một nửa nhu cầu năng lượng của cơ sở này mà không làm tăng mức tiêu thụ nước.

Big Tech under pressure to act on data centres’ thirst for water
Calls for a rethink on taking a scarce resource to cool overheated facilities are growing in the US
A liquid cooling system being installed on a row of Equinix data centre cabinets © Behnam Barghabany

Patrick Temple-West

Booming demand for artificial intelligence tools, accelerated by the uptake of generative AI, is putting an increasing strain on water supplies to cool the IT infrastructure underpinning the technology. Now, the companies operating these data centres are facing calls to make the facilities much more efficient and subject to greater regulation.
In the US, Virginia state legislators have advanced a bill aimed at addressing data centres’ water use. The bill would authorise municipalities to require centres to submit water use estimates as part of building requirements. Virginia is currently home to one of the world’s biggest concentrations of data centres, used by companies such as Amazon, Google and Microsoft.
The bill, which is waiting for approval or veto from governor Glenn Youngkin, reflects voters’ concerns about data centres draining local water resources. The Virginia Conservation Network, an environmental non-profit organisation, argued in February that the state of Virginia has no regulatory oversight of data centre development and that it should collect more information about their water usage in order to plan better.
“A major tech company’s data centres can consume many billions of litres of water annually, in some cases rivalling the water consumption of major beverage companies,” says Shaolei Ren, an associate professor in electrical and computer engineering at the University of California Riverside. He estimates that global demand for AI processing will consume 4.2bn-6.6bn cubic metres of water abstracted from ground or surface sources in 2027.
4.2bn-6.6bn cubic metres
Estimated abstraction of water needed globally for AI processing in 2027
Public anxiety about who is using water and for what purpose has grown since drought conditions affected Virginia and other parts of the US in 2024. Nearly every US state experienced abnormally dry conditions, according to the National Oceanic and Atmospheric Administration, the US climate agency.
Longer and exceptional droughts in the US pose risks of operational disruption to data centres, investment bank Jefferies said in a report last year.
Legislation, or the threat of it, and public concern about water use, has prompted some companies to take action. At Equinix, a big US data centre operator, water availability has been taken into account when deciding site locations.
The company says its data centres’ water use in 2023 was similar to that of a small US town annually. About 60 per cent of that water evaporated and 40 per cent went into the local wastewater system.
A network of metal pipes, valves, and thick insulated hoses in an industrial data center’s cooling system
Liquid cooling at Equinix facilities © Behnam Barghabany
“We’re constantly monitoring what’s happening from a regulatory perspective,” says Christopher Wellise, vice-president of sustainability at Equinix. Cooling techniques at its facilities include keeping more of the water in a closed loop.
“If you shift from traditional evaporative cooling to closed-loop cooling, you’re going to significantly reduce the need for water,” he explains. Evaporative cooling runs cold water between overheating materials and discharges the steam into open air. But in a closed-loop system, the water stays within the structure for reuse.
More stories from this report
Extreme rainfall puts cities on alert
Trump backlash adds to challenges for California water policymakers
Pollution-busters look to AI for better speed and accuracy
How a glass of recycled sewage helps on water shortages
Beijing faces pushback over ambitious hydropower project plans
The rise of AI has intensified the calls for action. Data centres that handle AI workloads do more intense processing and require six to 10 times more power than conventional data centres of similar size, says Noman Bashir, an expert in computing and climate impact at Massachusetts Institute of Technology’s Climate and Sustainability Consortium, an industry and academia collaboration.
He also notes that efforts to use cooling mixtures as an alternative to water are fading because the liquids used “have been found to be very toxic” — which means a return to water.
In August 2024, Microsoft announced a new design for data centres that would involve losing no water to evaporation when used for cooling. The tech company could save more than 125mn litres of water per year per facility, it said.
Even data centres with relatively low average water use can strain local infrastructure
Shaolei Ren, UC Riverside
The search may be on for water-saving technologies, but “relying on innovation alone to solve this challenge is not necessarily enough, at least in the short run”, says Christelle Khalaf, associate director of the government finance research centre at the University of Illinois in Chicago. That means governments stepping in, she argues, with regulation and siting guidelines to direct new data centres to places where water resources are less scarce.
“As more facilities are built, they risk competing with communities, agriculture, and industry for limited water resources,” UC Riverside’s Ren says. “Even data centres with relatively low average water use can strain local infrastructure due to their high peak water demand.”
Some data centre operators are already looking for locations with more reliable water supplies. One Equinix data centre in Toronto, for instance, pulls cold water from deep in Lake Ontario, which it says has cut the facility’s energy needs by half without increasing water consumption.

Không có file đính kèm.

Nguồn tham khảo

125

AI nghiên cứu AI chips-hardware-compute AI sinh-y-duoc 2025-03-19 03:14:24

GPU sinh học: BBB ra mắt Bionode - chip máy tính sử dụng tế bào thần kinh sống để phục vụ ứng dụng AI

Biological Black Box (BBB), công ty khởi nghiệp có trụ sở tại Baltimore, vừa công bố nền tảng Bionode - hệ thống tính toán tích hợp tế bào thần kinh sống được nuôi cấy trong phòng thí nghiệm với các bộ xử lý truyền thống.
Bionode sử dụng tế bào thần kinh từ tế bào gốc người và tế bào chuột để tạo ra chip máy tính sinh học, với "hàng trăm nghìn" tế bào được tích hợp vào một đĩa chứa 4.096 điện cực, tạo thành nền tảng cho một chip Bionode.
Ưu điểm của hệ thống này bao gồm khả năng tự tái cấu trúc của tế bào thần kinh, giảm tiêu thụ năng lượng, cải thiện hiệu quả xử lý và đẩy nhanh quá trình huấn luyện mô hình AI.
Các tế bào thần kinh trong Bionode có thể tồn tại hơn một năm trước khi cần thay thế và đã được triển khai cho ứng dụng thị giác máy tính và mô hình ngôn ngữ lớn (LLM).
BBB đã bắt đầu cung cấp công nghệ này cho khách hàng và đang đàm phán với hai đối tác để cấp phép công nghệ cho các ứng dụng thị giác máy tính, mặc dù công ty không tiết lộ tên cụ thể.
Alex Ksendzovsky, đồng sáng lập và CEO của BBB, đã làm việc với tế bào thần kinh trên điện cực từ năm 2005, cho biết: "Mạng lưới sinh học đã tiến hóa hàng trăm triệu năm thành hệ thống tính toán hiệu quả nhất từng được tạo ra."
Công ty là thành viên của Nvidia Inception (chương trình ươm tạo của Nvidia) và không xem mình là đối thủ trực tiếp của Nvidia. Ksendzovsky khẳng định: "Tính toán sinh học và tính toán silicon sẽ tồn tại song song. Chúng ta vẫn cần GPU và CPU để xử lý dữ liệu từ tế bào thần kinh."
Bionode đã được thử nghiệm như một lớp tiền xử lý cho các tác vụ phân loại AI, giúp giảm thời gian suy luận và tiêu thụ điện năng của GPU.
BBB đang chuyển từ Baltimore, Maryland đến Vùng Vịnh khi chuẩn bị mở rộng quy mô công nghệ của mình, mặc dù chưa công bố ngày ra mắt thương mại.
Công ty đang làm việc với các chuyên gia đạo đức và quy định để đảm bảo công nghệ được phát triển có trách nhiệm. Ksendzovsky nhấn mạnh: "Chúng tôi không cần hàng triệu tế bào thần kinh để xử lý toàn bộ môi trường như một bộ não. Chúng tôi chỉ sử dụng những gì cần thiết cho các tác vụ cụ thể, luôn ghi nhớ các cân nhắc về đạo đức."

📌 Bionode của BBB đại diện cho bước đột phá trong phần cứng AI, sử dụng tế bào thần kinh sống để tạo ra hệ thống tính toán tiết kiệm năng lượng hơn. Với khả năng tự tái cấu trúc, các chip sinh học này có thể giúp giải quyết vấn đề mở rộng quy mô của AI, vừa bổ sung cho GPU truyền thống vừa mở ra hướng đi mới cho tương lai của tính toán.

https://venturebeat.com/ai/gpus-go-biological-bbb-unveils-bionode-lab-grown-living-neuron-compute-for-ai-applications/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-03-19 03:10:41

Nvidia ra mắt dòng chip AI mới với Blackwell Ultra GB300 và Vera Rubin

Nvidia vừa công bố chip AI thế hệ mới Blackwell Ultra GB300 dự kiến ra mắt nửa cuối năm 2025, tiếp theo là Vera Rubin vào nửa cuối năm 2026 và Rubin Ultra vào nửa cuối năm 2027.
Blackwell Ultra GB300 giữ nguyên hiệu năng 20 petaflops AI như phiên bản Blackwell gốc nhưng nâng cấp bộ nhớ HBM3e lên 288GB (so với 192GB).
Cụm máy chủ DGX GB300 "Superpod" của Blackwell Ultra cung cấp 288 CPU, 576 GPU, 11,5 exaflops tính toán FP4 và 300TB bộ nhớ (tăng từ 240TB).
So với H100 (chip năm 2022), Blackwell Ultra mạnh hơn 1,5 lần về suy luận FP4 và có thể xử lý 1.000 token mỗi giây, gấp 10 lần thế hệ 2022, giúp cải thiện đáng kể tốc độ "suy luận AI".
Cluster NVL72 GB300 có thể chạy DeepSeek-R1 671B và cung cấp câu trả lời trong 10 giây (so với 1,5 phút của H100).
Nvidia sẽ ra mắt máy tính để bàn DGX Station trang bị một chip Blackwell Ultra, với 784GB bộ nhớ, khả năng kết nối 800Gbps và 20 petaflops hiệu năng AI.
Một rack GB300 NVL72 cung cấp 1,1 exaflops FP4, 20TB bộ nhớ HBM, 40TB "bộ nhớ nhanh", băng thông NVLink 130TB/giây và kết nối mạng 14,4TB/giây.
Vera Rubin sẽ mạnh hơn với 50 petaflops FP4 (tăng từ 20 petaflops), trong khi Rubin Ultra sẽ đạt 100 petaflops FP4 và gần 1TB bộ nhớ.
Rack NVL576 đầy đủ của Rubin Ultra hứa hẹn cung cấp 15 exaflops suy luận FP4 và 5 exaflops huấn luyện FP8, mạnh hơn 14 lần so với rack Blackwell Ultra.
Nvidia đã xuất xưởng 11 tỷ USD doanh thu từ Blackwell; chỉ riêng 4 khách hàng hàng đầu đã mua 1,8 triệu chip Blackwell trong năm 2025.
CEO Jensen Huang cho biết ngành công nghiệp cần "gấp 100 lần" sức mạnh tính toán so với dự đoán năm ngoái để đáp ứng nhu cầu.
Kiến trúc tiếp theo sau Vera Rubin sẽ là Feynman, dự kiến ra mắt năm 2028, được đặt theo tên nhà vật lý lý thuyết nổi tiếng Richard Feynman.

📌 Nvidia đang mở rộng thống trị thị trường AI với lộ trình chip 3 năm: Blackwell Ultra (2025), Vera Rubin (2026) và Rubin Ultra (2027). Với hiệu năng tăng đến 14 lần từ Blackwell Ultra đến Rubin Ultra, Nvidia đáp ứng nhu cầu tính toán AI ngày càng tăng, đã xuất xưởng 11 tỷ USD doanh thu từ Blackwell với 1,8 triệu chip bán ra.

https://www.theverge.com/news/631835/nvidia-blackwell-ultra-ai-chip-gb300

Không có file đính kèm.

Nguồn tham khảo

125

AI chips-hardware-compute 2025-03-19 02:53:55

Sự kiện GTC của Nvidia: Từ hội chợ khoa học đến "Super Bowl của AI" thu hút 25.000 người tham dự

Sự kiện GTC (Nvidia Developer Conference) năm 2025 của Nvidia dự kiến thu hút hơn 25.000 người tham dự, khác biệt hoàn toàn so với hội nghị đầu tiên năm 2009 chỉ có vài chục học giả.
CEO Jensen Huang, người được mệnh danh là "AI Jesus", sẽ phát biểu về tương lai của trí tuệ nhân tạo trong một sân vận động hockey NHL tại San Jose.
Sự kiện có sự góp mặt của nhiều lãnh đạo công nghiệp hàng đầu như Michael Dell (CEO Dell Technologies), Jeffrey Katzenberg (đồng sáng lập DreamWorks) và Bill McDermott (CEO ServiceNow).
Nvidia đã chuyển mình từ một công ty sản xuất chip đồ họa thành nhà cung cấp chip AI hàng đầu thế giới, đưa giá trị công ty tăng từ 8 tỷ USD năm 2009 lên gần 3 nghìn tỷ USD hiện nay.
Tại GTC 2025, Jensen Huang dự kiến sẽ giới thiệu thế hệ chip AI mới mang tên Rubin với hiệu suất nhanh hơn gấp 30 lần so với hiện tại.
Sự kiện cũng sẽ tập trung vào các ứng dụng AI thực tế như AI agent (có thể thực hiện tự động các nhiệm vụ như mua sắm) và các ứng dụng tương lai như robot kích thước người thật.
Nvidia đang đối mặt với thách thức khi các khách hàng lớn như Amazon, Google và Meta đang tự phát triển chip AI riêng.
Cổ phiếu Nvidia từng mất 600 tỷ USD giá trị trong một ngày khi nhà đầu tư phát hiện DeepSeek, một công ty nhỏ của Trung Quốc, đã tạo ra hệ thống AI tiên tiến với số lượng chip Nvidia ít hơn nhiều so với các công ty khác.
Quá trình chuẩn bị cho sự kiện GTC của Jensen Huang bắt đầu từ hai tháng trước, làm việc với các bộ phận sản phẩm và marketing, nhưng ông không viết sẵn bài phát biểu mà nói ứng khẩu trên sân khấu.
Lợi nhuận hàng năm của Nvidia đã tăng hơn 1.500% trong hai năm, từ 4,37 tỷ USD trong năm tài chính 2023 lên 72,88 tỷ USD vào năm ngoái.

📌 Từ hội nghị học thuật nhỏ năm 2009, Nvidia GTC đã trở thành sự kiện công nghệ hàng đầu với 25.000 người tham dự. Jensen Huang sẽ giới thiệu chip AI Rubin mới với hiệu suất gấp 30 lần, đối mặt với thách thức từ các đối thủ đang tự phát triển chip riêng.

https://www.nytimes.com/2025/03/18/technology/nvidia-gtc-conference-ai.html

Nvidia tổ chức sự kiện Super Bowl của A.I.
Nhà sản xuất chip khổng lồ đã biến hội nghị thường niên dành cho các nhà phát triển của mình từ một sự kiện học thuật thành một buổi gặp gỡ của các nhân vật quan trọng trong tương lai của trí tuệ nhân tạo.

Jensen Huang, mặc áo khoác da đen và quần jean đen, đứng trên sân khấu với một con robot nhỏ gần đó.
Jensen Huang, giám đốc điều hành của Nvidia, tại hội nghị thường niên dành cho các nhà phát triển của công ty vào năm 2024. Hơn 25.000 người dự kiến sẽ tham dự sự kiện năm nay ở San Jose, California.
Ảnh: Jim Wilson/The New York Times

Tripp Mickle
Bài viết của Tripp Mickle
Tripp Mickle là phóng viên công nghệ tại San Francisco.

18 tháng 3 năm 2025, 5:02 sáng theo giờ ET

Năm 2009, khi Nvidia tổ chức hội nghị nhà phát triển đầu tiên, sự kiện này giống như một hội chợ khoa học. Hàng chục học giả tập trung tại một khách sạn ở San Jose, California, nơi được trang trí bằng các bảng poster trắng trưng bày các nghiên cứu máy tính. Jensen Huang, giám đốc điều hành của nhà sản xuất chip, đi khắp sàn hội nghị như một giám khảo.

Năm nay, hội nghị nhà phát triển của Nvidia đã khác xa so với trước.
Hơn 25.000 người dự kiến sẽ tập trung vào thứ Ba tại sự kiện được gọi là Nvidia GTC. Đám đông sẽ lấp đầy một sân vận động của Giải khúc côn cầu quốc gia (National Hockey League) để lắng nghe bài phát biểu về tương lai của trí tuệ nhân tạo từ ông Huang, người được mệnh danh là “Chúa Giê-su của A.I.” Nvidia, nhà phát triển chip A.I. hàng đầu thế giới, cũng đã bao trùm toàn bộ San Jose trong sắc xanh neon và đen của công ty, phong tỏa các con phố trong thành phố và khiến giá khách sạn tăng vọt lên tới 1.800 USD/đêm.

Một loạt các nhà lãnh đạo trong ngành được kỳ vọng sẽ tham dự, bao gồm Michael Dell, giám đốc điều hành của Dell Technologies; Jeffrey Katzenberg, đồng sáng lập DreamWorks và WndrCo, một công ty đầu tư mạo hiểm; và Bill McDermott, giám đốc điều hành của ServiceNow.

“Nvidia tạo ra các con chip là nguồn sống cho A.I., vì vậy mọi người đều háo hức muốn tìm hiểu về những sản phẩm mới nhất và tốt nhất của họ,” Ali Farhadi, giám đốc điều hành của Viện Trí tuệ nhân tạo Allen, người cũng sẽ tham dự, cho biết. “Quy mô công nghệ được trưng bày tại đó sẽ rất ấn tượng.”

Việc hội nghị của Nvidia chuyển từ một sự kiện học thuật thành Super Bowl của A.I. — một chương trình kéo dài cả tuần trưng bày robot, các mô hình ngôn ngữ lớn và xe tự hành — là biểu tượng cho sự lột xác của công ty. Khi A.I. trở thành xu hướng chính, khách hàng đã đổ xô tìm mua các bộ xử lý đồ họa (GPU) của Nvidia, những con chip mạnh mẽ giúp tạo ra công nghệ này. Điều đó đã đẩy giá trị của nhà sản xuất chip này lên gần 3.000 tỷ USD, tăng từ 8 tỷ USD vào năm 2009.

Tuy nhiên, sự thăng tiến của Nvidia đã làm dấy lên nhiều câu hỏi. AI tạo sinh, có khả năng trả lời câu hỏi, tạo hình ảnh và viết mã, đã được ca ngợi vì tiềm năng nâng cao hiệu quả kinh doanh và tạo ra hàng nghìn tỷ USD giá trị kinh tế. Microsoft, Amazon, Google, Meta và các công ty khác đang chi hàng trăm tỷ USD để biến tiềm năng đó thành hiện thực.

Nhưng việc chi tiêu này đã làm dấy lên lo ngại trên Phố Wall và ở Thung lũng Silicon về việc liệu A.I. có mang lại đủ lợi nhuận để bù đắp cho chi phí khổng lồ đó hay không. Hơn nữa, quỹ đạo của công nghệ này có thể bị đảo lộn bởi các công ty mới như DeepSeek, một công ty nhỏ của Trung Quốc đã tạo ra một hệ thống A.I. tiên tiến với số lượng chip Nvidia ít hơn nhiều so với các công ty khác. (Vào tháng 1, khi các nhà đầu tư nhận ra những gì DeepSeek đã làm, Nvidia mất 600 tỷ USD giá trị chỉ trong một ngày.)

Tại Nvidia GTC, ông Huang sẽ tìm cách trấn an mọi người rằng A.I. sẽ mang lại đúng với tiềm năng của nó, Patrick Moorhead, nhà sáng lập của Moor Insights & Strategy, một công ty nghiên cứu công nghệ, cho biết. Ông Huang dự kiến sẽ trình bày chi tiết về cách các hệ thống A.I. đang cung cấp các dịch vụ mà mọi người sẽ sẵn sàng trả tiền, chẳng hạn như các trợ lý A.I. có thể tự động thực hiện các nhiệm vụ như mua sắm hàng tạp hóa. Ông cũng sẽ đề cập đến các ứng dụng A.I. trong tương lai, như việc phát triển các robot kích thước con người có thể đi lại và nhặt đồ.

Ngoài ra, ông Huang dự kiến sẽ nói về thế hệ chip A.I. tiếp theo của Nvidia, gọi là Rubin, có thể mang lại hiệu năng nhanh hơn tới 30 lần.

Nvidia từ chối bình luận về bài phát biểu của ông Huang.

Chip Rubin rất quan trọng để Nvidia duy trì vị thế dẫn đầu trong A.I. Công ty đang phải đối mặt với thách thức khi các khách hàng của họ, bao gồm Amazon, Google và Meta, đang tự phát triển chip A.I. của riêng mình. Và các chip của Nvidia cũng phải thay đổi khi các công ty A.I. tìm cách nâng cao hiệu năng của các mô hình A.I. của họ.

“Con tàu vàng sẽ dừng lại ngay lập tức nếu các công ty điện toán đám mây ngừng chi tiêu,” ông Moorhead nói. “Ông Huang cần phải chứng minh rằng ông ấy hiểu rõ những gì đang diễn ra ngoài kia.”

Khả năng thu hút đám đông của ông Huang gợi nhớ đến Steve Jobs của Apple. Trước các sự kiện lớn của công ty, nhà đồng sáng lập Apple đã dành nhiều ngày để diễn tập các bài phát biểu của mình về iPod, iPhone hoặc iPad mới trước khi bước lên sân khấu trong tiếng vỗ tay vang dội và dường như phát biểu mà không cần kịch bản.

Ông Huang, 62 tuổi, cũng chuẩn bị rất kỹ lưỡng cho Nvidia GTC. Hai tháng trước sự kiện, ông làm việc với các bộ phận sản phẩm của công ty để xác định nội dung công bố, Greg Estes, phó chủ tịch phụ trách marketing của Nvidia, cho biết. Ông Huang cũng làm việc với đội ngũ marketing để phát triển các slide và phần trình bày trên sân khấu, tạo các gạch đầu dòng và kiểm tra tính chính xác của các thông tin có thể được nhắc đến.

Nhưng ông Huang không bao giờ viết bài phát biểu, ông Estes cho biết. Khi bước lên sân khấu trong chiếc áo khoác da đen quen thuộc, ông phát biểu một cách tự nhiên. Một bài phát biểu được lên kế hoạch kéo dài 90 phút có thể kéo dài hơn 2 giờ.

“Đôi khi có sai sót và ông ấy sẽ nói, ‘Chúng tôi không diễn tập,’” ông Estes nói. “Ông ấy không đùa đâu. Đó thực sự là ‘nắm bắt và hành động.’”

Nvidia GTC trước đây là Hội nghị Công nghệ GPU (GPU Technology Conference), được thiết kế để khuyến khích các nhà phát triển sử dụng chip của công ty.

Nvidia Is Hosting the Super Bowl of A.I.
The giant chipmaker has transformed its annual developer conference from an academic event into a who’s who gathering for the future of artificial intelligence.

Listen to this article · 7:35 min Learn more
Share full article
Jensen Huang, wearing a black leather jacket and black jeans, stands on a stage with a small robot nearby.
Jensen Huang, Nvidia’s chief executive, at the company’s annual developer conference in 2024. More than 25,000 people are expected to attend this year’s event in San Jose, Calif. Credit...Jim Wilson/The New York Times
Tripp Mickle
By Tripp Mickle
Tripp Mickle reports on technology from San Francisco.
March 18, 2025, 5:02 a.m. ET

In 2009, when Nvidia held its first developer conference, the event was something of a science fair. Dozens of academics filled a San Jose, Calif., hotel decorated with white poster boards of computer research. Jensen Huang, the chipmaker’s chief executive, roamed the floor like a judge.
This year, Nvidia’s developer conference is far different.
More than 25,000 people are expected to congregate on Tuesday at the event, known as Nvidia GTC. The crowds will fill a National Hockey League arena to hear a speech about the future of artificial intelligence from Mr. Huang, who has been nicknamed “A.I. Jesus.” Nvidia, the world’s leading developer of A.I. chips, has also wrapped San Jose in the company’s neon green and black colors, shutting down city streets and sending hotel prices soaring as high as $1,800 a night.
A who’s who of industry leaders is expected to attend, including Michael Dell, the chief executive of Dell Technologies; Jeffrey Katzenberg, the co-founder of DreamWorks and WndrCo, a venture capital firm; and Bill McDermott, the chief executive of ServiceNow.
“Nvidia makes the chips that are oxygen for A.I., so people are on their toes to learn about their latest and greatest,” said Ali Farhadi, the chief executive of the Allen Institute for Artificial Intelligence, who is also attending. “The breadth of technology on display there is going to be phenomenal.”
The transformation of Nvidia’s conference from an academic event to the Super Bowl of A.I. — a weeklong showcase of robots, large language models and autonomous cars — is symbolic of the company’s metamorphosis. As A.I. has gone mainstream, customers have clamored for Nvidia’s graphics processing units, the powerful chips that help create the technology. That has propelled the chipmaker to a nearly $3 trillion valuation, up from $8 billion in 2009.
Yet Nvidia’s ascent has raised questions. Generative A.I., which can answer questions, create images and write code, has been celebrated for its potential to improve businesses and create trillions of dollars in economic value. Microsoft, Amazon, Google, Meta and others are spending hundreds of billions of dollars to make that idea a reality.
But the spending has prompted concerns across Wall Street and Silicon Valley about whether A.I. will make enough money to justify its staggering costs. And the technology’s trajectory can be upended by new entrants like DeepSeek, a small Chinese company that made a cutting-edge A.I. system with a small fraction of the Nvidia chips that other companies used. (In January, when investors realized what DeepSeek had done, Nvidia lost $600 billion in value on a single day.)
At Nvidia GTC, Mr. Huang will seek to reassure people that A.I. will deliver on its potential, said Patrick Moorhead, founder of Moor Insights & Strategy, a tech research firm. Mr. Huang is expected to elaborate on how A.I. systems are providing services that people will want to pay for, like A.I. agents, which can autonomously perform tasks such as shopping for groceries. He is also set to describe more futuristic uses for A.I., like the development of human-size robots that can walk and pick up things.
In addition, Mr. Huang is expected to talk about Nvidia’s next generation of A.I. chips, called Rubin, which may deliver as much as 30 times faster performance.
Editors’ Picks
12 St. Patrick’s Day Recipes to Make You Feel Extra Lucky
Eggs Are Scarce. These People Don’t Miss Them.
In the Land of the Jaguars
Nvidia declined to comment on Mr. Huang’s speech.
The Rubin chip is critical to Nvidia’s staying at the forefront of A.I. The company faces challenges as its customers, including Amazon, Google and Meta, make their own A.I. chips. And Nvidia’s chips also have to change as A.I. companies try to get better performance out of their A.I. models.
“The gravy train comes to a screeching halt if cloud companies stop spending,” Mr. Moorhead said. Mr. Huang “has to reinforce that he knows what’s going on out there.”
Mr. Huang’s ability to command a crowd is reminiscent of Apple’s Steve Jobs. Ahead of major company events, the Apple co-founder spent days rehearsing his speeches about a new iPod, iPhone or iPad, before taking the stage to thunderous applause and seeming to deliver his remarks as though they were unscripted.
Mr. Huang, 62, similarly prepares in great detail for Nvidia GTC. Two months ahead of the event, he works with the company’s product divisions to identify what to announce, said Greg Estes, Nvidia’s vice president of corporate marketing. Mr. Huang also works with the marketing team to develop slides and demonstrations to show onstage, creating bullet points and checking facts that he may cite.
But Mr. Huang never writes a speech, Mr. Estes said. When he takes the stage in his trademark black leather jacket, he speaks extemporaneously. A speech scheduled for 90 minutes can run more than two hours.
“Sometimes a mistake will happen and he’ll say, ‘You know, we don’t rehearse,’” Mr. Estes said. “He’s not kidding. It is ‘grip it and rip it.’”
Nvidia GTC was formerly the GPU Technology Conference, named after the graphics processing units, or GPUs. The event, which was designed to encourage developers to use the company’s chips, included a research summit where academics put up poster boards detailing how they had used the components for computing research. Mr. Huang spoke to attendees about what they did with the chips and, over the years, often heard that they were using them to develop A.I.
David Cox, who presented research at an early conference as a Harvard professor, said most attendees treated the academics as “this weird little footnote.” But he said Mr. Huang and other Nvidia executives took them seriously.
“They seemed to understand that we had something here,” said Mr. Cox, who is now the vice president of A.I. models at IBM Research.
In 2014, Mr. Huang began devoting the majority of his speech at the conference to the way Nvidia chips could be used for machine learning and A.I. Gaming developers, who used GPUs to render video game graphics and had long been the heart of the company’s business, were angered by the shift.
“They were like, ‘What the hell is this shiny new thing?’” said Naveen Rao, the chief A.I. officer at Databricks, which provides software tools for storing and analyzing large amounts of data. “We were like: ‘No. No. This is the sea change.’”
Mr. Huang bet that A.I. would drive tech’s next big boom and that GPUs would be essential. In 2016, Nvidia developed a supercomputer packed with its chips and delivered it to OpenAI, an A.I. lab. A little over six years later, OpenAI released the ChatGPT chatbot, unleashing an A.I. frenzy.
(The New York Times has sued OpenAI and its partner, Microsoft, for copyright infringement of news content related to A.I. systems. OpenAI and Microsoft have denied the claims.)
Since then, Nvidia’s finances have soared. The company, which was founded in 1993, increased its annual profit more than 1,500 percent in a two-year period to $72.88 billion last year from $4.37 billion in fiscal 2023.
“Jensen has become the celebrity C.E.O. he always wanted to be,” Mr. Rao said. “It’s an overnight success years in the making because he captured A.I.”

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green Telecom 2025-03-18 09:01:53

Báo cáo của Ciena: AI đang làm thay đổi hoàn toàn cách trung tâm dữ liệu kết nối và vận hành

Theo khảo sát mới của Ciena với hơn 1.300 chuyên gia trung tâm dữ liệu từ 12 thị trường toàn cầu, trí tuệ nhân tạo dự kiến sẽ tạo ra áp lực đáng kể lên lưu lượng mạng, đặc biệt là kết nối giữa các trung tâm dữ liệu (DCI).
Jürgen Hatheier, giám đốc công nghệ quốc tế của Ciena nhận định rằng khối lượng công việc AI đang định hình lại toàn bộ cảnh quan trung tâm dữ liệu, từ xây dựng cơ sở hạ tầng đến nhu cầu băng thông.
Lưu lượng dữ liệu mạng dự kiến sẽ tăng trưởng mạnh mẽ, chủ yếu do AI thúc đẩy. Báo cáo chỉ ra rằng khi AI tạo sinh trở nên đa phương thức hơn, cùng với việc áp dụng tự động hóa dựa trên AI, agent AI và suy luận, lưu lượng mạng sẽ tăng theo những cách khó dự đoán.
Hơn 50% người tham gia khảo sát dự đoán rằng khối lượng công việc AI sẽ vượt qua các ứng dụng đám mây truyền thống và dữ liệu lớn trong 2-3 năm tới.
Trên toàn cầu, 43% trung tâm dữ liệu mới được lên kế hoạch xây dựng sẽ dành riêng cho việc xử lý khối lượng công việc AI. Có sự khác biệt theo khu vực: người tham gia khảo sát từ Ấn Độ và Indonesia dự đoán hơn 50% trung tâm dữ liệu mới sẽ dành cho AI, trong khi Na Uy và Thụy Điển dự đoán con số này gần 33%.
Áp lực kết nối đang gia tăng do hệ sinh thái AI trong tương lai sẽ là một mạng lưới các trung tâm dữ liệu kết nối với nhau. Điều này đòi hỏi đầu tư đáng kể vào cơ sở hạ tầng trung tâm dữ liệu.
Người tham gia khảo sát dự đoán băng thông mạng DCI sẽ tăng tối thiểu gấp 6 lần trong 5 năm tới, tương đương tốc độ tăng trưởng kép hàng năm 40-60%. Con số này gấp đôi so với mức tăng trưởng thông thường.
DCI sẽ phải cân bằng giữa chức năng và kết nối của trung tâm dữ liệu biên và trung tâm. Hầu hết người tham gia khảo sát dự đoán rằng các mô hình ngôn ngữ lớn sẽ hoạt động trong các cơ sở trung tâm dữ liệu phân tán: các trung tâm lớn hỗ trợ nhu cầu tính toán và năng lượng cho việc đào tạo mô hình AI. Trong khi đó, các trung tâm dữ liệu biên sẽ xử lý các ứng dụng suy luận nhạy cảm với độ trễ.
Hiệu suất DCI cần phải theo kịp, và các khoản đầu tư đang được thực hiện ngay bây giờ để chuẩn bị. Mạng lưới dự kiến sẽ cần 800 Gbps hoặc cao hơn, chẳng hạn như 1,6 Tbps trên mỗi bước sóng. Hơn 50% người tham gia khảo sát cho rằng 1,6 TBps sẽ là "yêu cầu cần thiết".
Hatheier nhấn mạnh: "Cuộc cách mạng AI không chỉ về khả năng tính toán mà còn về kết nối. Nếu không có nền tảng mạng phù hợp, tiềm năng đầy đủ của AI không thể được hiện thực hóa."

📌 AI đang thúc đẩy nhu cầu kết nối trung tâm dữ liệu tăng gấp 6 lần trong 5 năm tới, với 43% trung tâm dữ liệu mới sẽ dành riêng cho AI. Các nhà điều hành phải chuẩn bị cơ sở hạ tầng DCI với khả năng truyền tải lên đến 1,6 Tbps để đáp ứng kỷ nguyên mới này.

https://www.rcrwireless.com/20250317/ai-infrastructure/ai-datacenter-networking

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute AI startup-M&A 2025-03-18 06:59:57

Cuộc chiến chip: Startup Trung Quốc phá vỡ "thế độc quyền" của Nvidia trong AI với framework mới

Một framework AI mới phát triển bởi các nhóm liên kết với Đại học Thanh Hoa của Trung Quốc được cho là có thể giảm sự phụ thuộc vào chip Nvidia trong quá trình suy luận (inference) của mô hình AI.
Framework có tên Chitu, do startup Qingcheng.AI và nhóm nghiên cứu dẫn đầu bởi giáo sư khoa học máy tính Zhai Jidong tại Đại học Tsinghua phát triển, được công bố vào ngày thứ Sáu.
Chitu là framework suy luận hiệu năng cao cho các mô hình ngôn ngữ lớn (LLMs), có thể hoạt động trên chip sản xuất tại Trung Quốc.
Framework này thách thức vị thế thống trị của GPU dòng Hopper của Nvidia trong việc hỗ trợ một số mô hình như DeepSeek-R1.
Các framework AI đóng vai trò như những khối xây dựng của các mô hình AI thông minh phức tạp, cung cấp bộ thư viện và công cụ giúp nhà phát triển thiết kế, huấn luyện và xác thực mô hình phức tạp một cách hiệu quả.
Chitu đã được mở nguồn từ thứ Sáu và hỗ trợ các mô hình chính bao gồm DeepSeek và dòng Llama của Meta Platforms.
Khi thử nghiệm với phiên bản đầy đủ của DeepSeek-R1 sử dụng GPU A800 của Nvidia, framework này đạt được tốc độ suy luận mô hình tăng 315% đồng thời giảm 50% mức sử dụng GPU so với các framework nguồn mở nước ngoài.
Sáng kiến này là một phần của nỗ lực rộng lớn hơn từ các công ty AI Trung Quốc nhằm giảm sự phụ thuộc vào Nvidia, hãng có các GPU hiệu suất cao đang bị kiểm soát xuất khẩu bởi Mỹ.
Nvidia hiện bị Washington cấm bán các chip tiên tiến H100 và H800 thuộc dòng Hopper cho khách hàng đặt tại Trung Quốc.

📌 Chitu, framework AI mới từ Qingcheng.AI và Đại học Thanh Hoa, tăng tốc độ suy luận lên 315% và giảm 50% mức sử dụng GPU khi chạy DeepSeek-R1 so với các giải pháp nước ngoài, đánh dấu bước tiến quan trọng trong nỗ lực tự chủ công nghệ của Trung Quốc trước các lệnh cấm của Mỹ.

https://www.scmp.com/tech/tech-war/article/3302516/chip-war-chinese-start-aims-break-nvidias-grip-ai-new-model-framework

Không có file đính kèm.

Nguồn tham khảo

169

AI chips-hardware-compute 2025-03-18 06:22:45

CEO Jensen Huang sẽ bảo vệ vị thế thống trị thị trường AI của NVIDIA, sẽ ra mắt hệ thống chip Vera Rubin.

CEO Nvidia Jensen Huang sẽ bảo vệ vị thế thống trị của công ty trị giá gần 3.000 tỷ USD trong lĩnh vực chip AI tại hội nghị nhà phát triển phần mềm thường niên tuần này.
Cổ phiếu Nvidia đã giảm sau khi công ty Trung Quốc DeepSeek ra mắt chatbot cạnh tranh, được cho là tiêu tốn ít công suất tính toán hơn so với các đối thủ.
Doanh thu của Nvidia đã tăng hơn gấp 4 lần trong 4 năm qua lên 130,5 tỷ USD nhờ bán các chip AI có giá lên đến hàng chục nghìn đô la mỗi chiếc.
Tại hội nghị, Nvidia dự kiến công bố chi tiết về hệ thống chip Vera Rubin, đặt theo tên nhà thiên văn học Mỹ người tiên phong về khái niệm vật chất tối, dự kiến sẽ đi vào sản xuất hàng loạt trong năm nay.
Chip tiền nhiệm Blackwell (được công bố năm ngoái) đang chậm ra thị trường do sự chậm trễ trong sản xuất, ảnh hưởng đến biên lợi nhuận của Nvidia.
Thị trường AI đang chuyển từ "training" (huấn luyện mô hình) sang "inference" (suy luận - khi mô hình sử dụng kiến thức để đưa ra câu trả lời). Nvidia chiếm hơn 90% thị phần trong lĩnh vực training nhưng đối mặt cạnh tranh trong inference.
Nhiều startup cũng như đối thủ truyền thống như AMD đang đặt cược vào việc có thể bán chip thực hiện công việc với chi phí thấp hơn, đặc biệt là chi phí điện năng, nơi chip của Nvidia tiêu thụ quá nhiều điện đến mức các công ty AI đang nghiên cứu lò phản ứng hạt nhân để cung cấp năng lượng.
Nvidia cho rằng một loại AI mới gọi là "reasoning" (lập luận) sẽ có lợi cho họ. Các chatbot reasoning suy nghĩ thành tiếng, tạo ra vài dòng văn bản rồi đọc lại để suy nghĩ thêm về vấn đề - tất cả đều sử dụng nhiều sức mạnh tính toán mà chip Nvidia xuất sắc.
Tại hội nghị, Nvidia cũng dự kiến sẽ gợi ý về kế hoạch trong các thị trường tính toán khác, bao gồm tính toán lượng tử và nỗ lực xây dựng chip xử lý trung tâm máy tính cá nhân.
Jensen Huang sẽ phát biểu bài diễn văn chính vào thứ Ba.

📌 Nvidia đang phải bảo vệ vị thế thống trị thị trường chip AI trị giá 3.000 tỷ USD khi đối mặt với sự cạnh tranh từ DeepSeek của Trung Quốc. Công ty sẽ ra mắt hệ thống chip Vera Rubin trong năm 2025, đồng thời mở rộng sang lĩnh vực tính toán lượng tử và chip PC để duy trì ưu thế trong ngành.

https://www.reuters.com/technology/nvidia-ceo-defend-ai-dominance-competition-intensifies-2025-03-17/

Không có file đính kèm.

Nguồn tham khảo

Semi-Cloud-DC-Green AI chips-hardware-compute 2025-03-18 01:00:55

AI đang thay đổi cách thế giới xây dựng máy tính

AI đang thúc đẩy sự thay đổi căn bản nhất trong lĩnh vực máy tính kể từ thời kỳ đầu của World Wide Web, buộc các công ty phải xây dựng lại hệ thống máy tính từ nền tảng.
Trong khi trung tâm dữ liệu đầu tiên của Google tại The Dalles, Oregon (2006) có chi phí ước tính 600 triệu USD, OpenAI và các đối tác mới đây đã công bố kế hoạch đầu tư khoảng 100 tỷ USD cho các trung tâm dữ liệu mới, bắt đầu với một khuôn viên ở Texas. Họ dự định bơm thêm 400 tỷ USD vào cơ sở này và các cơ sở khác trên khắp Hoa Kỳ.
Sự chuyển đổi trong máy tính đang định hình lại không chỉ công nghệ mà còn cả tài chính, năng lượng và cộng đồng. Các công ty cổ phần tư nhân đang đổ tiền vào các công ty trung tâm dữ liệu, và thợ điện đang đổ xô đến các khu vực xây dựng các cơ sở này.
Các công ty công nghệ đang yêu cầu sức mạnh tính toán và nguồn điện nhiều hơn mức thế giới có thể cung cấp. OpenAI hy vọng huy động hàng trăm tỷ USD để xây dựng các nhà máy chip máy tính ở Trung Đông. Google và Amazon gần đây đã ký kết thỏa thuận để xây dựng và triển khai một thế hệ lò phản ứng hạt nhân mới.
Vào tháng 12/2024, một công ty nhỏ của Trung Quốc, DeepSeek, tuyên bố đã xây dựng một trong những hệ thống AI mạnh nhất thế giới bằng cách sử dụng ít chip máy tính hơn nhiều so với dự đoán, làm dấy lên câu hỏi về chi tiêu điên cuồng của Thung lũng Silicon.
Mục tiêu đầy tham vọng của nhiều công ty công nghệ lớn là tạo ra trí tuệ nhân tạo tổng quát (AGI) - một cỗ máy có thể làm bất cứ điều gì bộ não con người có thể làm.
Amazon, Meta, Microsoft và công ty mẹ của Google, Alphabet, gần đây đã cho biết chi tiêu vốn của họ - chủ yếu được sử dụng để xây dựng trung tâm dữ liệu - có thể vượt quá 320 tỷ USD trong năm nay, gấp hơn hai lần so với hai năm trước.
Bước nhảy vọt trong máy tính cho AI được thúc đẩy bởi một thành phần nhỏ: các chip máy tính chuyên dụng gọi là đơn vị xử lý đồ họa (GPU), ban đầu được thiết kế để hiển thị đồ họa cho trò chơi điện tử nhưng lại có khả năng chạy các phép toán cho mạng nơ-ron, nền tảng của chatbot và các công nghệ AI hàng đầu khác.

📌 AI đang tạo ra biến đổi lịch sử trong ngành máy tính, với các gã khổng lồ công nghệ đầu tư hơn 320 tỷ USD vào năm 2025 cho trung tâm dữ liệu. Các thiết bị GPU trở thành nền tảng của cuộc cách mạng này, thúc đẩy việc phát triển AGI và buộc các công ty phải xây dựng lại toàn bộ cơ sở hạ tầng tính toán.

https://www.nytimes.com/interactive/2025/03/16/technology/ai-data-centers.html

AI đang thay đổi cách thế giới xây dựng máy tính
Cade Metz, Karen Weise, Marco Hernandez, Mike Isaac và Anjali Singhvi – Ngày 16 tháng 3 năm 2025

Đây là sự thay đổi mang tính nền tảng nhất đối với lĩnh vực điện toán kể từ những ngày đầu của mạng lưới World Wide Web. Giống như cách các công ty đã hoàn toàn tái cấu trúc hệ thống máy tính của họ để thích ứng với internet thương mại mới vào những năm 1990, giờ đây họ đang xây dựng lại từ đầu — từ các thành phần nhỏ nhất đến cách máy tính được lắp đặt và cung cấp năng lượng — để đáp ứng với trí tuệ nhân tạo (AI).

Các công ty công nghệ lớn đã xây dựng các trung tâm dữ liệu máy tính trên khắp thế giới trong suốt hai thập kỷ qua. Các trung tâm này được trang bị đầy đủ máy tính để xử lý lưu lượng truy cập trực tuyến khổng lồ từ các dịch vụ internet của các công ty, bao gồm công cụ tìm kiếm, ứng dụng email và các trang thương mại điện tử.

Tuy nhiên, những cơ sở đó chỉ là "hạng nhẹ" so với những gì sắp tới. Vào năm 2006, Google đã mở trung tâm dữ liệu đầu tiên của họ tại The Dalles, bang Oregon, với chi phí hoàn thành ước tính khoảng 600 triệu USD. Vào tháng 1, OpenAI và một số đối tác đã công bố kế hoạch chi khoảng 100 tỷ USD cho các trung tâm dữ liệu mới, bắt đầu với một khuôn viên tại Texas. Họ có kế hoạch sẽ bơm thêm 400 tỷ USD vào các trung tâm này và các cơ sở khác trên khắp nước Mỹ trong những năm tới.

Sự thay đổi trong lĩnh vực điện toán này không chỉ đang định hình lại công nghệ mà còn ảnh hưởng sâu rộng đến tài chính, năng lượng và cộng đồng. Các công ty cổ phần tư nhân đang đổ tiền vào các công ty trung tâm dữ liệu. Các thợ điện đang đổ xô đến các khu vực nơi các trung tâm dữ liệu này đang được xây dựng. Ở một số nơi, người dân địa phương đang phản đối các dự án này, lo ngại rằng chúng sẽ mang lại nhiều tác hại hơn là lợi ích.

Hiện tại, các công ty công nghệ đang yêu cầu nhiều sức mạnh tính toán và nhiều điện năng hơn mức mà thế giới có thể cung cấp. OpenAI hy vọng sẽ huy động được hàng trăm tỷ USD để xây dựng các nhà máy sản xuất chip máy tính ở Trung Đông. Google và Amazon gần đây đã đạt được thỏa thuận để xây dựng và triển khai thế hệ lò phản ứng hạt nhân mới. Và họ muốn làm điều này nhanh nhất có thể.

Một dãy chip máy tính trên bảng mạch xanh.
Các chip AI của Google trên một bảng mạch. Công ty cần hàng nghìn chip như thế này để xây dựng các chatbot và các công nghệ AI khác.
Christie Hemm Klok cho The New York Times

Quan điểm "càng lớn càng tốt" đã bị thách thức vào tháng 12 khi một công ty nhỏ của Trung Quốc có tên DeepSeek tuyên bố rằng họ đã xây dựng được một trong những hệ thống AI mạnh mẽ nhất thế giới chỉ sử dụng số lượng chip máy tính ít hơn nhiều so với những gì các chuyên gia từng nghĩ là có thể. Điều này đã đặt ra câu hỏi về sự chi tiêu điên cuồng của Silicon Valley.

Tuy nhiên, các "ông lớn" công nghệ của Mỹ không hề nao núng. Mục tiêu đầy tham vọng của nhiều công ty này là tạo ra trí tuệ nhân tạo tổng quát (Artificial General Intelligence - AGI) — một cỗ máy có thể làm mọi thứ mà bộ não con người có thể làm — và họ vẫn tin rằng việc sở hữu nhiều sức mạnh tính toán hơn là điều cần thiết để đạt được mục tiêu này.

Amazon, Meta, Microsoft và công ty mẹ của Google, Alphabet, gần đây đã cho biết rằng chi tiêu vốn của họ — phần lớn được dùng để xây dựng các trung tâm dữ liệu — có thể lên tới hơn 320 tỷ USD trong năm nay. Con số này cao hơn gấp đôi so với mức chi tiêu của họ cách đây hai năm.

The New York Times đã đến thăm năm khuôn viên trung tâm dữ liệu mới ở California, Utah, Texas và Oklahoma, đồng thời đã phỏng vấn hơn 50 giám đốc điều hành, kỹ sư, doanh nhân và thợ điện để kể câu chuyện về cơn khát vô độ của ngành công nghệ đối với loại sức mạnh tính toán mới này.

"Những gì có thể đã diễn ra trong thập kỷ tới đã được nén lại trong khoảng thời gian chỉ hai năm," Sundar Pichai, giám đốc điều hành của Google, cho biết trong một cuộc phỏng vấn với The Times. "AI chính là chất xúc tác."

Chip máy tính mới cho AI mới

Bước nhảy vọt khổng lồ trong lĩnh vực điện toán cho AI được thúc đẩy bởi một thành phần nhỏ bé: các chip máy tính chuyên dụng được gọi là đơn vị xử lý đồ họa (Graphics Processing Unit - GPU).

Các công ty như nhà sản xuất chip ở Silicon Valley là Nvidia ban đầu thiết kế các chip này để xử lý đồ họa cho các trò chơi điện tử. Nhưng các GPU này lại có khả năng đặc biệt trong việc thực hiện các phép toán phức tạp, là cơ sở cho cái gọi là mạng nơ-ron — những mạng lưới có thể học các kỹ năng bằng cách phân tích lượng dữ liệu khổng lồ. Mạng nơ-ron là nền tảng của các chatbot và các công nghệ AI hàng đầu khác.

Kể từ khi các nhà nghiên cứu AI nhận ra sức mạnh của GPU, họ đã tranh giành nhau để có được càng nhiều chip càng tốt. Giá của các GPU tăng vọt. Trong quý đầu tiên của năm 2025, doanh thu của Nvidia từ việc bán chip cho AI đã tăng hơn 150% so với cùng kỳ năm trước.

Nhưng các công ty công nghệ không chỉ chi tiền để mua chip — họ còn chi tiêu cho mọi thứ xung quanh các chip đó. Các trung tâm dữ liệu ngày càng lớn hơn, được làm mát bằng nước thay vì bằng quạt thông thường để duy trì hoạt động của các chip AI này. Các trung tâm cũng tiêu thụ lượng điện khổng lồ — nhiều trung tâm đang tiêu thụ lượng điện tương đương với các thành phố cỡ trung bình.

Việc chuyển đổi này đã khiến các công ty công nghệ phải tìm kiếm các giải pháp năng lượng thay thế. Google và Amazon đang tài trợ cho việc phát triển các lò phản ứng hạt nhân thế hệ mới. Microsoft đã ký hợp đồng với một công ty khởi nghiệp về nhiệt hạch để phát triển công nghệ lò phản ứng nhiệt hạch.

"Chúng tôi cần nhiều năng lượng hơn bao giờ hết," một giám đốc của Google cho biết. "AI có thể thay đổi thế giới, nhưng nó cần sức mạnh để làm điều đó."

Các nhà khoa học cảnh báo rằng việc gia tăng sản xuất chip máy tính và nhu cầu về năng lượng có thể làm trầm trọng thêm tình trạng biến đổi khí hậu, nhưng đối với các công ty công nghệ, AI đang mang lại cơ hội lớn đến mức họ không thể bỏ qua.

"AI là cơ hội lớn nhất trong thế kỷ này," một giám đốc của OpenAI cho biết. "Chúng tôi không thể để vuột mất nó."

Không có file đính kèm.

Nguồn tham khảo

113

AI chips-hardware-compute 2025-03-16 07:35:13

Cuộc đua sống còn của Nvidia: Khi Jensen Huang đối mặt với DeepSeek, thuế quan và tương lai không chắc chắn của AI

Jensen Huang, CEO Nvidia, hiện đang là người giàu thứ 15 thế giới theo Bloomberg Billionaires Index, đã biến Nvidia thành công ty hàng nghìn tỷ đô nhờ vào làn sóng AI.
Nvidia đã chứng kiến sự chuyển đổi mạnh mẽ trong cơ cấu doanh thu: năm 2014, mảng bán chip cho trung tâm dữ liệu chỉ chiếm dưới 5% doanh thu, nhưng đến năm 2023 vượt ngưỡng 50%, và năm ngoái chiếm gần 80%.
Công ty đang đối mặt với nhiều mối đe dọa tiềm ẩn: đối thủ cạnh tranh tìm cách cạnh tranh về giá, khách hàng lớn nhất đang phát triển chip AI riêng, và các cuộc chiến thương mại của Trump đang gây khó khăn.
Vào tháng 1/2025, thế giới công nghệ chấn động trước mô hình AI của Trung Quốc - DeepSeek-R1, được cho là có hiệu suất gần bằng với các sản phẩm của Mỹ nhưng chi phí đào tạo thấp hơn nhiều, khiến Nvidia mất gần 600 tỷ USD giá trị thị trường trong một ngày.
Mặc dù Nvidia đã công bố doanh thu và lợi nhuận quý vượt kỳ vọng vào ngày 26/2, cùng với dự báo doanh số lạc quan, giá cổ phiếu vẫn tiếp tục giảm, đặc biệt khi Trump liên tục thay đổi kế hoạch thuế quan.
Jensen Huang hiểu rõ rằng sức mạnh của Nvidia hiện đang phụ thuộc quá nhiều vào nhóm khách hàng lớn (hyperscalers) như Alphabet, Amazon, Meta và Microsoft, chiếm khoảng một nửa doanh thu mảng trung tâm dữ liệu.
Để giảm phụ thuộc, Nvidia đang mở rộng chiến lược bằng cách định vị mình không chỉ là nhà sản xuất chip mà còn là nhà cung cấp giải pháp máy tính toàn diện, bao gồm cả phần cứng và phần mềm.
Công ty đang đẩy mạnh vào các lĩnh vực như y tế, logistics, sản xuất và robot. Với mảng y tế, Nvidia đang hợp tác với các bệnh viện như Ottawa Hospital để phát triển trợ lý ảo phục vụ bệnh nhân.
Huang dành sự quan tâm đặc biệt cho "AI vật lý" - các ứng dụng như robot, xe tự lái và nhà máy tự động hoàn toàn. Tại hội nghị CES tháng 1, ông dự đoán rằng "khoảnh khắc ChatGPT cho robot đang ở ngay trước mắt" với tiềm năng thị trường hàng nghìn tỷ đô.
Nền tảng Omniverse của Nvidia hỗ trợ mô phỏng kỹ thuật số, cho phép doanh nghiệp thử nghiệm các kịch bản trong thế giới ảo trước khi triển khai vào thực tế. Công ty cũng đã phát triển mô hình Cosmos để hỗ trợ robot thực hiện nhiều nhiệm vụ đa dạng.
Tuy nhiên, một số cựu nhân viên và đối tác cho rằng phần mềm của Nvidia không thực sự đáp ứng được kỳ vọng như cách họ quảng cáo, và khách hàng thường chỉ nhiệt tình với phần cứng của công ty hơn là giải pháp phần mềm.

📌 Từ công ty chip đồ họa, Nvidia đã biến mình thành gã khổng lồ AI trị giá hàng nghìn tỷ đô dưới sự lãnh đạo của Jensen Huang. Đối mặt với sự cạnh tranh từ DeepSeek-R1 của Trung Quốc và các khách hàng lớn tự phát triển chip, Nvidia đang đa dạng hóa sang AI vật lý và phần mềm để duy trì vị thế.

https://www.bloomberg.com/news/features/2025-03-14/can-nvidia-stock-go-higher-jensen-huang-looks-to-extend-ai-boom

Nvidia nhìn xa hơn DeepSeek và thuế quan để hướng đến chương tiếp theo của AI
Không ai hưởng lợi nhiều hơn từ làn sóng bùng nổ AI như CEO Jensen Huang của Nvidia. Trước những dấu hiệu đáng lo ngại, ông đang cố gắng kéo dài thời kỳ hoàng kim.

Bởi Joshua Brustein và Ian King
14 tháng 3, 2025 lúc 3:00 PM UTC

Vào một buổi tối thứ Hai giữa tháng 1, Jensen Huang đã tổ chức một bữa tiệc dành cho đám đông các giám đốc điều hành trong lĩnh vực chăm sóc sức khỏe và công nghệ ở San Francisco. Khi khoảng 400 khách mời đổ về căn phòng Gold sang trọng của khách sạn Fairmont, CEO của Nvidia Corp., mặc chiếc áo khoác da đen quen thuộc của mình, đã thực hiện một loạt những câu bông đùa kiểu “ông bố đam mê công nghệ.” “Bạn gọi một con robot tìm thuốc giỏi hơn bạn là gì?” ông hỏi. “Khám phá thuốc hỗ trợ bằng máy tính!”

Buổi tối tiếp tục trôi qua, và Huang đã uống ít nhất hai ly rượu vang đỏ, thêm một chút đồ uống nặng hơn — và điều này đã mang lại nhiều sự thích thú cho các vị khách tham dự. Huang đã châm chọc Patrick Collison, CEO của Stripe Inc., một người từng bỏ học tại Viện Công nghệ Massachusetts (MIT), vì không thông minh bằng vợ của ông. Huang cũng trêu đùa Ari Bousbib, CEO của nhà cung cấp phần mềm chăm sóc sức khỏe Iqvia Inc., rằng tên công ty của ông trông giống như “bạn ngủ gật trên bàn phím rồi nhấn gửi đi.”

Những người quen biết Huang sẽ nhận ra phong cách của ông: tự tin, hơi ngây thơ và đủ hài hước để được coi là quyến rũ hoặc khó xử, tùy thuộc vào người nghe. Tuy nhiên, có một điều quan trọng đã thay đổi: quy mô của khán giả. Làn sóng bùng nổ trí tuệ nhân tạo đã đưa Nvidia trở thành một công ty trị giá hàng nghìn tỷ USD, ngay cả khi nó chưa thực sự trở thành một cái tên quen thuộc trong mọi gia đình. (Không có sự đồng thuận về cách phát âm tên công ty. Hướng dẫn thương hiệu chính thức của Nvidia gợi ý phát âm âm tiết đầu tiên là “en,” nhưng một số người vẫn sử dụng “in,” hoặc thậm chí là “nuh,” điều này rõ ràng là sai.) Tuy vậy, Nvidia đã trở thành một thế lực không thể chối cãi trong làng công nghệ toàn cầu.

Huang — hiện là người giàu thứ 15 trên thế giới, theo Chỉ số Tỷ phú Bloomberg — không ngừng di chuyển khắp nơi để truyền bá cho Nvidia và AI. Nhiều phóng viên đã ghi lại cảnh ông ăn mì trong một khu chợ đêm ở Đài Bắc; ông đã bế em bé, ký vô số chữ ký, ném những cú ném bóng đầu tiên trong các trận đấu bóng chày Major League, dẫn dắt đám đông tại các hội nghị công nghệ cùng hô vang khẩu hiệu, xuất hiện trên sân khấu cùng các CEO của Goldman Sachs, Meta Platforms và Salesforce, và trò chuyện riêng tại Nhà Trắng với Tổng thống Donald Trump.

Xu hướng của Huang, ngay cả khi rời khỏi văn phòng và có vẻ đã hơi say, là luôn tìm cách chốt thỏa thuận. Tại Fairmont, ông thường bắt đầu bằng một lời trêu đùa nhẹ nhàng, sau đó là một bài thuyết phục được cân nhắc kỹ lưỡng. Ông đã châm chọc Jacob Thaysen, CEO của công ty công nghệ sinh học Illumina Inc., vì bị hói, rồi ngay sau đó khen ngợi Illumina vì đã chuyển sang sử dụng các đơn vị xử lý đồ họa (GPU) đặc trưng của Nvidia — một sự thay đổi mà ông nói sẽ đẩy nhanh quá trình giải trình tự gen.

Sau khi chọc ghẹo Christina Zorn, giám đốc hành chính của Mayo Clinic, vì đã từ bỏ việc học ngành động vật học để trở thành luật sư, Huang tự hào tuyên bố rằng chip và phần mềm của Nvidia đang giúp trung tâm y tế này tạo ra AI có thể đưa ra các chẩn đoán y khoa. Có thể, ông gợi ý, những người khác trong đám đông cũng sẽ muốn có một công cụ tương tự?

Chuyến đi vòng quanh thế giới của Huang có vẻ như là một vòng vinh quang, nhưng cũng có sự lo lắng rõ rệt ở đó. Ông hiểu rõ rằng vận may của các tập đoàn có thể thay đổi, và ông đã chứng kiến điều đó xảy ra một cách tàn nhẫn trong ngành công nghiệp bán dẫn. Đã có tiền lệ về các đợt bùng nổ và sụp đổ trong các công ty hạ tầng công nghệ vì sản phẩm của họ có xu hướng trở thành hàng hóa thông thường theo thời gian. Khoảnh khắc mà dường như nhu cầu đối với chip GPU của Nvidia — "bộ não" của các hệ thống AI hiện đại — từ các công ty điện toán đám mây lớn nhất thế giới là vô tận sẽ không kéo dài mãi mãi, và Huang đang quyết tâm đảm bảo một chỗ đứng mới trong khi vị thế hiện tại của ông vẫn đang vững mạnh.

Có rất nhiều yếu tố đe dọa làm chậm bước tiến của Nvidia. Các đối thủ đang tìm cách hạ giá để cạnh tranh, các khách hàng lớn nhất của công ty đang cố gắng tự xây dựng chip AI của riêng họ, và các cuộc chiến thương mại của Trump đang làm phức tạp mọi thứ theo nhiều cách khác nhau. Phần lớn các GPU của Nvidia được sản xuất tại Đài Loan trước khi được vận chuyển đi khắp thế giới, vì vậy chúng đặc biệt nhạy cảm với thuế quan. Do Trung Quốc là thị trường chip lớn nhất thế giới, nên các quy định về an ninh quốc gia đặc biệt hạn chế việc bán hàng vào thị trường này cũng là một mối đe dọa nghiêm trọng.

Thậm chí đáng báo động hơn là một số nhà đầu tư đang lo ngại rằng làn sóng bùng nổ AI đã đạt đỉnh. Hai tuần sau sự kiện kín của Huang, thế giới bắt đầu chú ý đến một mô hình AI mới do Trung Quốc phát triển có tên là DeepSeek-R1. Nhà phát triển của nó tuyên bố rằng mô hình này gần như mạnh ngang với bất kỳ mô hình nào khác hiện nay, trong khi chi phí huấn luyện của nó chỉ bằng một phần nhỏ so với các đối thủ tại Mỹ. Nvidia đã mất gần 600 tỷ USD giá trị vốn hóa thị trường chỉ trong một ngày — mức giảm lớn nhất của bất kỳ công ty nào trong lịch sử.

Giá cổ phiếu của Nvidia vẫn chưa phục hồi. Vào ngày 26 tháng 2, Nvidia công bố doanh thu và lợi nhuận hàng quý vượt xa kỳ vọng và đưa ra dự báo doanh số lạc quan cho quý hiện tại. Trong một cuộc gọi hội nghị với các nhà đầu tư vào ngày hôm đó, Huang giải thích rằng các mô hình như DeepSeek có thể làm tăng nhu cầu đối với chip của Nvidia bằng cách gia tăng tổng khối lượng tính toán AI. Tuy nhiên, giá cổ phiếu của Nvidia vẫn sụt giảm — và sau đó tiếp tục giảm sâu hơn vào tuần tiếp theo khi Trump khiến thị trường chao đảo với các kế hoạch thuế quan thay đổi liên tục. Lần đầu tiên kể từ khi ChatGPT ra mắt — vốn phụ thuộc vào chip của Nvidia — việc nghi ngờ về Nvidia dường như không còn là điều điên rồ nữa.

Cơ hội lớn tiếp theo để Huang kể câu chuyện của mình sẽ đến vào tuần tới, khi hội nghị thường niên của Nvidia diễn ra tại trung tâm thành phố San Jose, California, với sự tham gia của các đối tác kinh doanh, các startup và những người quan sát khác. Khoảng 900 công ty sẽ thuyết trình về cách họ sử dụng công nghệ của Nvidia hoặc tham gia vào các hoạt động trong suốt sự kiện kéo dài 6 ngày. Trong bài phát biểu quan trọng, Huang dự kiến sẽ trình bày về nhiều hướng đi mà ông đang dẫn dắt Nvidia nhằm tìm kiếm những chân trời mới trong lĩnh vực AI.

Công ty đã từ chối cung cấp cơ hội phỏng vấn Huang cho bài viết này, nhưng các cuộc phỏng vấn với các giám đốc điều hành và đối tác kinh doanh của ông cho thấy rằng Huang đang thúc đẩy một cảm giác cấp bách tột độ tại Nvidia. Sau nhiều năm xây dựng cơ sở hạ tầng AI, ông đang nóng lòng muốn thấy các ứng dụng AI có ý nghĩa vượt ra ngoài lĩnh vực công nghệ. Như Huang sẽ nói với bất kỳ ai sẵn sàng lắng nghe, Nvidia không chỉ đang xây dựng các con chip, mà còn phát triển phần mềm sẽ thúc đẩy sự thay đổi trong các lĩnh vực lớn như chăm sóc sức khỏe, hậu cần, sản xuất và robot. Những thay đổi đó sẽ biện minh cho các khoản đầu tư khổng lồ mà các khách hàng hiện tại của công ty đã bỏ ra cho AI, đồng thời làm cho Nvidia trở nên vô giá đối với một phạm vi công ty rộng lớn hơn nhiều.

“Chúng ta cần có các ứng dụng thực sự cho AI,” Aaron Jacobson, đối tác tại New Enterprise Associates Inc., một công ty đầu tư mạo hiểm đôi khi đầu tư cùng Nvidia vào các startup AI, nói. “Chúng ta không thể chỉ bán cuốc và xẻng nếu không ai thực sự tìm thấy vàng.” Theo ẩn dụ về cơn sốt vàng thường được áp dụng cho Huang, ông không chỉ muốn trở thành người bán cuốc và xẻng. Ông muốn dẫn dắt các thợ đào đến những cánh đồng, sàng lọc những xẻng đất đầu tiên và chỉ ra những điểm sáng lấp lánh.

Trong hơn 30 năm tồn tại, Nvidia đã hoạt động trong thế giới mà Intel Corp. tạo ra — công ty dẫn đầu không thể tranh cãi trong ngành công nghiệp bán dẫn khi Huang nghỉ việc tại LSI Logic Corp. để thành lập một công ty sản xuất chip cùng với 2 kỹ sư khác. Sản phẩm chính của Intel là đơn vị xử lý trung tâm (CPU), một thành phần quan trọng cho hầu như mọi máy tính xách tay và máy chủ. Điểm mạnh lớn nhất của CPU là tính linh hoạt; Huang và các đồng nghiệp đã thành lập công ty của họ dựa trên ý tưởng rằng các con chip chuyên biệt sẽ tốt hơn trong một số tác vụ nhất định, chẳng hạn như chỉnh sửa phim và trò chơi điện tử. GPU của họ chia nhỏ các tác vụ thành nhiều phần nhỏ, sau đó giao cho một loạt bộ xử lý nhỏ hơn để xử lý song song.

Vào những ngày đầu của Nvidia, các tác vụ này gần như chỉ giới hạn trong việc tạo ra đồ họa trò chơi điện tử. Lý do Nvidia hiện có giá trị cao gấp 28 lần Intel là vì Huang đã đặt cược rằng, cuối cùng, ai đó sẽ tìm ra nhu cầu cho loại chip này. Để làm cho GPU hoạt động hiệu quả trong các tác vụ vượt xa nhu cầu của các game thủ, cần phải có những thay đổi vật lý đối với bản thân con chip. Để giúp các nhà phát triển tận dụng các thuộc tính cụ thể của chip, công ty đã phát hành một ngôn ngữ lập trình có tên CUDA (viết tắt của “compute unified device architecture”) vào năm 2006.

Các game thủ — những người chỉ đơn giản muốn có các con chip mạnh hơn — và các nhà đầu tư, những người cho rằng Nvidia nên tập trung bán các con chip đó cho các game thủ, đã bối rối. Huang không ưu tiên nhu cầu của bất kỳ nhóm khách hàng nào khác; ông chỉ hy vọng rằng những thị trường mới sẽ xuất hiện vào một ngày nào đó. Nvidia bắt đầu giới thiệu chip cho nhiều ứng dụng khác nhau, bao gồm cái gọi là “máy tính hiệu năng cao,” nơi các máy chạy các phép tính cực kỳ phức tạp để hỗ trợ, chẳng hạn như thăm dò dầu khí hoặc dự báo thời tiết. Đó hóa ra là một thị trường sinh lời nhưng rất nhỏ, và AI hiện đại ngày nay, vốn sử dụng các phương pháp hoàn toàn khác, đang dần thay thế nó.

Trong số những người đầu tiên áp dụng CUDA là các nhà nghiên cứu chuyên về một nhánh khoa học máy tính từng không được ưa chuộng có tên là học sâu (deep learning). Kỹ thuật này dựa vào một kiến trúc tính toán có tên là mạng nơ-ron (neural network), nơi thông tin được đẩy qua các lớp nút được mô phỏng theo các nơ-ron trong não người. Các nhà nghiên cứu nhận ra rằng GPU hoạt động tốt trong các hệ thống như vậy và bắt đầu thiết kế chúng dựa trên nền tảng của Nvidia. Khi làm vậy, họ nhận thấy sự cải thiện đáng kinh ngạc về hiệu suất, đặt nền tảng cho các hệ thống ngày nay có thể diễn giải hình ảnh và tạo ra văn bản giống như con người.

Tất cả những điều này ban đầu diễn ra mà không có bất kỳ sự thúc đẩy nào từ Nvidia. Nhưng Huang đã nhận ra cơ hội này. Nvidia bắt đầu gặp gỡ các nhà nghiên cứu — nhiều người trong số họ bắt đầu chuyển sang làm việc tại các công ty công nghệ lớn hoặc thành lập công ty riêng — và điều chỉnh các sản phẩm của công ty để phù hợp với nhu cầu của ngành công nghiệp AI đang nổi lên. Vì vẫn chưa có nhiều tiền trong lĩnh vực học sâu vào thời điểm đó, Huang gần như không có đối thủ.

Hoạt động kinh doanh AI của Nvidia bắt đầu phát triển chậm, rồi tăng tốc rất nhanh.

Không có nhiều công ty có khả năng xây dựng các cơ sở hạ tầng như vậy, vì thế sự chuyển đổi của Nvidia thành một công ty trung tâm dữ liệu AI đã gắn chặt số phận của công ty với một vài thực thể đứng đầu ngành công nghệ Mỹ. Vào giữa năm 2023, Nvidia bắt đầu thêm một tuyên bố từ chối trách nhiệm vào các báo cáo tài chính của mình, mô tả rủi ro mà tình trạng này mang lại. Hiện tại, Nvidia cho biết các công ty "hyperscaler" chiếm khoảng một nửa hoạt động kinh doanh trung tâm dữ liệu của công ty. (Nvidia không nêu tên các khách hàng trong các báo cáo tài chính, và danh sách này thay đổi theo từng quý, nhưng luôn bao gồm Alphabet, Amazon.com, Meta Platforms hoặc Microsoft.)

Đây là một công việc cực kỳ béo bở nếu có thể nắm bắt được. Như một cựu giám đốc điều hành của Nvidia — người yêu cầu giấu tên để tránh hậu quả trong công việc — nói: "Ai mà không muốn có gần như độc quyền trong một lĩnh vực mà các công ty có tiềm lực tài chính tốt nhất thế giới đều cần đến?" Bỏ qua những lo lắng về DeepSeek, 4 công ty hyperscaler này được dự báo sẽ chi hàng trăm tỷ USD cho đầu tư vốn chỉ riêng trong năm 2025, và một phần đáng kể trong số đó sẽ chảy thẳng vào túi của Nvidia. Dự án Stargate trị giá 500 tỷ USD mà OpenAI, Oracle và SoftBank công bố tại Nhà Trắng vào tháng 1 cũng xoay quanh các con chip mới của Nvidia.

Tuy nhiên, các khách hàng không phải lúc nào cũng hài lòng với nỗ lực của Nvidia trong việc đóng gói các GPU mà họ cần với các sản phẩm đi kèm mà họ không muốn. Bất chấp mong muốn của công ty trong việc bán cả một hệ thống máy tính hoàn chỉnh, các công ty AI lớn thường chỉ muốn một phần cứng để đặt ở lớp dưới cùng của hệ thống. Các nhà cung cấp dịch vụ đám mây đang xây dựng cơ sở hạ tầng riêng để phù hợp nhất với phần mềm của họ, và họ cũng muốn bán trực tiếp cho khách hàng nhiều loại dịch vụ nhất có thể.

Vì thế, Huang đang bị cuốn vào một cuộc cạnh tranh liên tục với các khách hàng lớn nhất của mình. Đó chính xác là kiểu động lực khiến các cơ quan quản lý chính phủ phải chú ý, đặc biệt là khi tình trạng thiếu nguồn cung thường có nghĩa là Nvidia quyết định xem khách hàng nào sẽ được nhận chip trước. Về phần mình, Huang khẳng định rằng công ty đưa ra các quyết định đó dựa trên khả năng của khách hàng trong việc đưa sản phẩm vào hoạt động ngay lập tức, và rằng việc cung cấp các hệ thống máy tính hoàn chỉnh sẽ rút ngắn thời gian để các sản phẩm của Nvidia được đưa vào sử dụng.

Sự căng thẳng tự nhiên với các công ty hyperscaler là lý do lớn khiến Huang và các lãnh đạo của ông dành rất nhiều thời gian để nói về các phần khác trong hoạt động kinh doanh của Nvidia — những phần mang lại doanh thu thấp hơn nhiều. Xu hướng tập trung vào thị trường tiếp theo đã mang lại kết quả phi thường cho Nvidia với AI. Nhưng những nỗ lực trước đây để mở rộng kinh doanh đã dẫn đến không ít thất bại. Nỗ lực của Nvidia nhằm thâm nhập vào thị trường smartphone đã thất bại, và các dự đoán của Huang từ một thập kỷ trước rằng xe tự lái sắp trở thành hiện thực đã không thành công.

Vẫn còn nhiều câu hỏi lớn chưa có lời giải về các giả định làm nền tảng cho làn sóng bùng nổ AI hiện tại, như sự hoảng loạn liên quan đến DeepSeek đã cho thấy. Hầu hết tác động kinh tế của AI tạo sinh cho đến nay đến từ việc xây dựng cơ sở hạ tầng — bản thân điều này là một canh bạc rằng các ứng dụng AI có khả năng thay đổi thế giới sẽ xuất hiện và làm cho việc đầu tư đó trở nên cần thiết. Mặc dù có cảm giác phổ biến rằng AI đã làm đảo lộn mọi thứ, nhưng những ứng dụng thực sự mang tính đột phá phần lớn vẫn chưa được hiện thực hóa.

Không có sự đồng thuận về việc điều gì sẽ xảy ra tiếp theo. Các dự báo lạc quan dự đoán sự thay đổi hoàn toàn trên phạm vi toàn cầu. Nhưng Daron Acemoglu, nhà kinh tế tại MIT và là người đã giành giải Nobel Kinh tế năm 2024, đã công bố một bài nghiên cứu vào năm ngoái ước tính rằng AI sẽ chỉ đóng góp dưới 0,53% vào tổng năng suất các yếu tố — một thước đo quan trọng về hiệu quả kinh tế — trong vòng 10 năm tới. Acemoglu lập luận rằng những người lạc quan đang đánh giá thấp mức độ khó khăn trong việc tìm ra các ứng dụng kinh tế của AI khi những nhiệm vụ dễ dàng nhất đã được tự động hóa. “Tôi không nghi ngờ về khả năng của AI tạo sinh, nhưng cách bạn sử dụng nó cho hoạt động kinh doanh vẫn là một câu hỏi chưa có lời giải,” ông nói. “Hiện tại, các doanh nghiệp đang chịu áp lực phải sử dụng AI vì có quá nhiều sự cường điệu xung quanh nó.”

Các giám đốc điều hành của Nvidia không hề ngần ngại trong việc thúc đẩy sự cường điệu đó. Kimberly Powell, phó chủ tịch phụ trách mảng chăm sóc sức khỏe của Nvidia, nhấn mạnh vào các ứng dụng thực tiễn của AI mà nhóm của bà đang phát triển. Powell nói rằng các mô hình AI sẽ đẩy nhanh quá trình phát triển các loại thuốc mới, trong khi robot sẽ "quan sát" các ca phẫu thuật và chú thích các video về quy trình phẫu thuật. Các nhân viên bệnh viện ảo sẽ có thể giao tiếp tốt hơn với các bệnh nhân thuộc các sắc tộc khác nhau bằng cách điều chỉnh diện mạo của mình hoặc, khi đối phó với trẻ em lo lắng, biến thành các nhân vật hoạt hình.

Kết quả của tất cả những điều này, theo Powell, là Nvidia có thể giúp các bệnh viện trực tiếp sử dụng AI để vận hành hiệu quả hơn vào thời điểm hệ thống chăm sóc sức khỏe đang đối mặt với một loạt thách thức như dân số già, chi phí cung ứng tăng cao và tình trạng thiếu hụt nhân công. Bà chỉ ra công việc của Nvidia với Bệnh viện Ottawa, một trong những bệnh viện lớn nhất của Canada, về việc tạo ra một đại lý kỹ thuật số có thể trả lời các câu hỏi của bệnh nhân trước phẫu thuật. Dịch vụ này sẽ không giải quyết được mọi vấn đề của ngành, nhưng đối với các bệnh viện triển khai nó, chatbot có thể đảm bảo tất cả các câu hỏi quan trọng được giải đáp trước khi phẫu thuật, từ đó giảm số lượng các ca phẫu thuật phải hoãn lại — điều gây tốn kém lớn cho các nhà cung cấp dịch vụ y tế. “Đây là một cách suy nghĩ hoàn toàn khác,” Powell nói.

Hỗ trợ việc triển khai từ phía Ottawa là Mathieu LeBreton, giám đốc trải nghiệm kỹ thuật số của bệnh viện. Ottawa đang lên kế hoạch xây dựng một cơ sở mới, và với sự phổ biến của AI, LeBreton cho rằng sẽ là thiếu sót nếu không đưa ra một kế hoạch tích hợp công nghệ này. “Chúng tôi là một ngành rất thận trọng với rủi ro, nhưng chúng tôi cảm thấy mình có trách nhiệm phải tìm hiểu về điều này,” ông nói.

Hiện tại, quy mô của tầm nhìn AI trong bệnh viện Ottawa chưa rộng lớn như của Nvidia. Ottawa chưa cho phép AI truy cập vào dữ liệu bệnh nhân vì các lý do nhạy cảm. LeBreton cho biết bệnh viện thậm chí còn chưa xem xét khả năng để robot đo các chỉ số sinh tồn hoặc tự động thực hiện các ca phẫu thuật. “Chúng tôi vẫn đang chờ phiên bản 1.0,” ông nói.

Tầm nhìn của Nvidia về AI vật lý là minh họa điển hình cho cách công ty đang định vị mình cho giai đoạn tiếp theo của AI. Nó nhận được rất nhiều sự chú ý trong nội bộ công ty — cả hai người con trưởng thành của Huang đều là nhân viên của Nvidia, làm việc trong các bộ phận tập trung vào AI vật lý. Một làn sóng bùng nổ trong lĩnh vực robot sẽ mang lại cho Nvidia cơ hội bán rất nhiều chip robot cho rất nhiều khách hàng mới, đồng thời làm tăng nhu cầu đối với chip trung tâm dữ liệu để huấn luyện các mô hình AI của họ. Và Nvidia đang khẳng định rằng công ty có thể đẩy nhanh quá trình này bằng cách xây dựng phần mềm, nhờ đó các khách hàng tiềm năng của công ty sẽ không phải tự làm mọi thứ từ con số không.

Một ví dụ về nỗ lực của công ty trong lĩnh vực phần mềm là Omniverse. Hệ thống này tạo điều kiện cho các mô phỏng kỹ thuật số, hoặc như Huang mô tả, là các mô phỏng đa vũ trụ (multiverse) — cho phép hiển thị cách các hành động cụ thể sẽ diễn ra trong thế giới thực. Ví dụ, một chủ nhà máy có thể xem trước viễn cảnh khi nhiều robot tự động di chuyển qua lại trong cơ sở của mình cùng một lúc để tìm ra cách sắp xếp để chúng không cản trở nhau. Dữ liệu từ các mô phỏng này có thể được sử dụng để huấn luyện các mô hình AI, dạy cho robot cách xử lý ngày càng nhiều nhiệm vụ hơn. Tại Las Vegas, Huang đã công bố rằng Nvidia đã tạo ra một mô hình như vậy, có tên là Cosmos.

Người điều hành Omniverse tại Nvidia là Rev Lebaredian, một phó tướng lâu năm của Huang, người có bộ râu muối tiêu và luôn mang theo một danh sách dài các câu nói đặc trưng của Jensen Huang. AI vật lý là một "thị trường có giá trị bằng 0 tỷ USD," ông nói — một ngành công nghiệp mà hiện tại chưa ai thực sự kiếm được tiền, nhưng phần thưởng cuối cùng sẽ là khổng lồ. Nếu để đạt được điều đó đòi hỏi phải đầu tư mạnh tay vào việc xây dựng phần mềm mà những người khác chưa thấy có động cơ thương mại để phát triển, thì Nvidia rất sẵn sàng làm điều đó. “Chúng tôi biết rõ trạng thái cuối cùng mà chúng tôi muốn đạt được,” Lebaredian nói. “Không ai có thể nói cho bạn chính xác con đường đi là gì, nhưng một điều mà Nvidia làm rất tốt là luôn cảnh giác và linh hoạt.” Đây là một thành công lớn đối với Nvidia khi nói đến học sâu (deep learning) và, theo quan điểm của Lebaredian, cả xe tự lái. Mặc dù công nghệ xe tự lái hiện đang bị chậm tiến độ so với dự đoán ban đầu của Huang, Nvidia vẫn coi vấn đề này đã được giải quyết về mặt kỹ thuật. “Tôi biết trông có vẻ không giống như vậy, vì chúng ta vẫn chưa thấy xe tự lái xuất hiện ở khắp mọi nơi,” Lebaredian thừa nhận. “Nhưng đó là vấn đề về triển khai.”

Tuy nhiên, bên ngoài trụ sở của Nvidia, đây không phải là quan điểm chung về xe tự lái. Cũng có rất nhiều hoài nghi về tính khả thi của một khoảnh khắc "ChatGPT cho robot" và về việc phần mềm của Nvidia thực sự đóng vai trò gì trong việc hiện thực hóa điều đó. Bài thuyết trình của Huang tại CES có bao gồm một bản demo về Omniverse và Cosmos giúp vận hành một nhà kho tự động, nhưng khi trao đổi với các phóng viên sau đó, Nvidia và các đối tác của công ty thừa nhận rằng họ vẫn chưa tung ra công nghệ này cho khách hàng thực tế.

Ryan Hickman, người từng làm việc với Omniverse trước khi rời Nvidia vào giữa năm 2023, cho rằng bài thuyết trình tại CES là ví dụ điển hình cho xu hướng của công ty trong việc tạo ra các bản demo không phản ánh đúng thực tế về những gì sản phẩm của Nvidia có thể làm được. Kế hoạch của Nvidia để tiến xa hơn trong chuỗi công nghệ (tech stack), theo ông, đang bị cản trở bởi sự thiếu nhiệt tình từ phía khách hàng khi Nvidia cố gắng tiến xa hơn. “Nvidia rất giỏi về chip và cả phần mềm điều khiển chạy trên các chip đó, các API — họ thực sự rất giỏi về những điều đó,” ông nói. “Nhưng điều họ hoàn toàn kém là bất cứ thứ gì mang tính chủ quan và liên quan đến trải nghiệm người dùng.”

Nvidia bác bỏ quan điểm này, và khách hàng của công ty nói rằng, để công bằng mà nói, Nvidia phản hồi rất nhanh đối với những khiếu nại của họ. Điều này thường xuyên xảy ra khi Huang trực tiếp tham dự một cuộc họp, lắng nghe quan điểm của khách hàng về những thiếu sót của sản phẩm Nvidia. Ngay sau đó, ông yêu cầu khắc phục ngay lập tức, và trong vòng vài ngày, hoặc thậm chí vài giờ, khách hàng đã nhận được thông báo cập nhật. Lập trường chính thức của công ty là họ hoàn toàn hài lòng khi khách hàng lựa chọn theo kiểu "a la carte" — tức là lựa chọn các sản phẩm riêng lẻ mà họ cảm thấy hữu ích.

Dù vậy, trong các cuộc phỏng vấn với các giám đốc điều hành tại một số công ty robot đang làm việc với Nvidia, một xu hướng chung đã xuất hiện: sự phấn khích không giấu giếm về phần cứng của Nvidia, sau đó là sự thờ ơ rõ ràng đối với phần mềm của công ty. Raquel Urtasun, CEO của Waabi — một công ty xe tải tự lái 4 năm tuổi — cho biết AI tạo sinh "đã thay đổi mọi thứ" trong lĩnh vực của bà. Ngồi trước một bảng trắng phủ đầy những phép tính khó hiểu tại văn phòng của mình ở Toronto, bà giải thích cách công nghệ này đang thu hẹp khoảng cách giữa mô phỏng kỹ thuật số của thế giới thực và việc lái xe thực tế. Điều này, theo bà, đã cải thiện đáng kể hiệu quả trong việc đào tạo xe tải tự lái.

Nvidia là nhà đầu tư của Waabi, và Urtasun cho biết công ty của bà đang cân nhắc sử dụng Cosmos. Nhưng khi được hỏi liệu công việc mô phỏng hiện tại của Waabi có dựa vào phần mềm của Nvidia hay không, bà dường như tỏ ra ngạc nhiên. “Chúng tôi không cần sử dụng trình mô phỏng của người khác,” bà nói.

Khi cuộc trò chuyện chuyển sang phần cứng của Nvidia, Urtasun không thể che giấu sự phấn khích. Một trong những sản phẩm được kỳ vọng sẽ được Nvidia công bố tại hội nghị vào tuần tới là Thor — máy tính tích hợp trên xe tự lái của công ty. Urtasun gọi đó là “một con chip cực kỳ, cực kỳ thú vị,” và Waabi đang xây dựng xe tải của mình xung quanh con chip này. Sau 15 năm làm việc trong lĩnh vực xe tự lái, Urtasun cho biết xe tải của công ty bà hiện đang thực hiện các chuyến đi thương mại với tài xế an toàn. Bước tiếp theo là triển khai dịch vụ thương mại tại Texas mà không cần ai ngồi sau vô lăng — đúng như những gì Huang đã dự đoán. Bà cho biết năm nay có thể sẽ là năm mọi thứ thành hiện thực.

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-03-14 16:48:16

Chip mới từ Trung Quốc có thể truyền 4,75 nghìn tỷ tham số mô hình AI chỉ trong 1 giây

Nhóm nghiên cứu từ Đại học Fudan ở Trung Quốc đã phát triển chip quang tích hợp silicon đa mode (high-order mode multiplexer) cho phép truyền dữ liệu quang siêu cao trên chip.
Kết quả nghiên cứu đã được công bố trên tạp chí Nature Communications và mang đến giải pháp mới cho kết nối quang trong các trung tâm dữ liệu và máy chủ tính toán hiệu năng cao.
Công nghệ này đặt nền tảng vững chắc cho AI tạo sinh, tính toán song song quy mô lớn và huấn luyện mô hình.
Khi các mô hình ngôn ngữ AI phát triển quy mô lớn hơn, băng thông truyền thông giữa các chip tính toán thông minh đang trở thành thách thức ngày càng lớn.
Nhóm nghiên cứu từ Trường Khoa học và Công nghệ Thông tin, Đại học Fudan đã tích hợp công nghệ ghép kênh đa chiều vào kết nối quang trên chip thông qua thiết kế và tối ưu hóa chính xác.
Đổi mới này làm tăng đáng kể thông lượng truyền dữ liệu đồng thời đạt được hiệu quả cao trong tiêu thụ điện năng và độ trễ truyền dẫn.
Công nghệ này có khả năng mở rộng và tương thích mạnh mẽ, áp dụng cho các nhu cầu tính toán hiệu năng cao khác nhau.
Các bài kiểm tra cho thấy chip hỗ trợ tốc độ 38 Tbps (Terabit mỗi giây), có nghĩa là nó có thể hoàn thành việc truyền 4,75 nghìn tỷ tham số của một mô hình lớn trong một giây.
Tiến bộ này nâng cao đáng kể hiệu quả và độ tin cậy trong truyền thông khi huấn luyện mô hình lớn và cụm máy tính, cung cấp hỗ trợ mạnh mẽ cho AI, huấn luyện mô hình và tính toán được tăng tốc bởi GPU.
Ma Jihua, chuyên gia ngành viễn thông, cho biết mặc dù hầu hết chip quy mô lớn hiện nay là điện tử, nghiên cứu về chip quang đã nhận được động lực, tạo điều kiện cho sự chuyển đổi từ truyền dẫn điện tử sang quang học.
Việc tích hợp các thành phần quang và điện tử vẫn còn là một thách thức, vì truyền thông thường dựa vào công nghệ CMOS.
Công nghệ mới cho phép kết nối dựa trên quang học, giảm đáng kể độ trễ truyền dẫn và cải thiện hiệu quả.
Hệ thống ghép kênh đa mode (high-order) nâng cao đáng kể hiệu quả truyền dẫn so với hệ thống đơn mode truyền thống, phù hợp với nhu cầu ngày càng tăng về truyền dữ liệu tốc độ cao, khối lượng lớn, đặc biệt trong các ứng dụng AI.
Ma Jihua dự đoán công nghệ mới có thể cải thiện đáng kể việc huấn luyện AI trong nước, nâng cao hiệu quả sử dụng năng lượng và khả năng thương mại hóa, với "các đột phá lớn trong ứng dụng có thể xuất hiện trong những năm tới".

📌 Nhóm nghiên cứu Trung Quốc đã phát triển chip quang tích hợp hỗ trợ tốc độ truyền dữ liệu 38 Tbps, có thể xử lý 4,75 nghìn tỷ tham số mô hình AI trong 1 giây. Công nghệ này hứa hẹn cách mạng hóa hiệu suất huấn luyện mô hình AI, giảm độ trễ và tiêu thụ điện năng.

https://www.globaltimes.cn/page/202503/1330091.shtml

Không có file đính kèm.

Nguồn tham khảo

Semi-Cloud-DC-Green AI chips-hardware-compute 2025-03-14 10:58:01

Báo cáo Deloitte: AI và hạ tầng dữ liệu ở Đông Nam Á: Cơ hội nghìn tỷ USD

AI đang trở thành xu hướng quan trọng nhất của thế kỷ, với tiềm năng tạo ra giá trị hàng nghìn tỷ USD trên toàn cầu. Đến năm 2030, AI dự kiến đóng góp 1 nghìn tỷ USD vào GDP của Đông Nam Á, giúp khu vực này trở thành nền kinh tế lớn thứ tư thế giới.
Hoa Kỳ và Trung Quốc đang đẩy mạnh đầu tư vào AI. Mỹ ban hành lệnh hành pháp 14179 và khung kiểm soát xuất khẩu vào tháng 1/2025 để tăng cường vị thế trong AI. Trung Quốc cũng đã tung ra quỹ đầu tư AI trị giá 60 tỷ RMB (8,2 tỷ USD).
Các công ty công nghệ lớn dự kiến chi 320 tỷ USD vào AI trong năm 2025:
- Alphabet: 75 tỷ USD
- Amazon: 100 tỷ USD
- Meta: 65 tỷ USD
- Microsoft: 80 tỷ USD
GenAI đang phát triển mạnh:
- Năm 2024, các ứng dụng AI đã được tải xuống 17 tỷ lần, với tổng thời gian sử dụng lên tới 7,7 tỷ giờ.
- ChatGPT có 350 triệu người dùng hàng tháng và 4,7 tỷ lượt truy cập vào tháng 1/2025.
- Character.ai có 29 triệu người dùng hàng tháng, trung bình 98 phút/ngày.
Chuỗi giá trị của GenAI bao gồm 3 mảng chính:
- Ứng dụng: Các ứng dụng tiêu dùng, chính phủ và doanh nghiệp
- Nền tảng: Các mô hình cơ bản, công cụ DevOps và hạ tầng lưu trữ
- Hạ tầng: GPU, trung tâm dữ liệu và cơ sở năng lượng tái tạo
Tiềm năng tạo giá trị:
- Ứng dụng: Các ứng dụng AI tiêu dùng phát triển nhanh nhưng khu vực Đông Nam Á có cơ hội lớn hơn trong mảng doanh nghiệp và chính phủ.
- Nền tảng: Đông Nam Á nên tập trung vào các mô hình mã nguồn mở, tinh chỉnh để phát triển các mô hình ngôn ngữ lớn (LLM) cho khu vực. Singapore đã khởi động Chương trình LLM Đa phương tiện Quốc gia (NMLP) trị giá 70 triệu SGD để xây dựng hệ sinh thái LLM đầu tiên trong khu vực.
- Hạ tầng: Dự kiến chiếm 60% tổng quy mô thị trường vào năm 2035, bao gồm GPU và các trung tâm dữ liệu phục vụ nhu cầu nội địa.
Đầu tư vào GPU và đám mây GPU:
- Nhu cầu GPU toàn cầu cho suy luận AI chiếm 85% vào năm 2028.
- Các trung tâm dữ liệu cho AI tại Đông Nam Á đang được xây dựng tại Indonesia (200 triệu USD) và Malaysia (4,3 tỷ USD).
- Singtel triển khai dịch vụ GPU-as-a-Service (GPUaaS) để cung cấp hạ tầng AI cho khu vực.
Nhu cầu điện năng:
- Tiêu thụ điện của trung tâm dữ liệu dự kiến tăng gấp đôi từ 536 TWh vào năm 2025 lên 1.065 TWh vào năm 2030 (chiếm 3,7% tổng lượng tiêu thụ điện toàn cầu).
- Đông Nam Á cần phát triển các giải pháp năng lượng tái tạo:
  - Malaysia: Năng lượng mặt trời và sinh khối
  - Singapore: Lò phản ứng hạt nhân mô-đun nhỏ (SMR)
  - Indonesia: Năng lượng địa nhiệt
Vai trò của chính phủ:
- Phát triển hệ sinh thái dữ liệu quốc gia và cơ sở hạ tầng AI.
- Thu hút các công ty công nghệ lớn thông qua các chính sách rõ ràng và ưu đãi đầu tư.
- Quản lý rủi ro về an ninh dữ liệu, quyền riêng tư và an ninh mạng.
Vai trò của doanh nghiệp:
- Cân nhắc mô hình tài trợ hoặc đồng tài trợ cho các trung tâm dữ liệu.
- Đặt chiến lược thị trường phù hợp để khai thác giá trị.
- Đánh giá kỹ cơ hội trong chuỗi giá trị và xác định mức đầu tư hợp lý.
Vai trò của nhà đầu tư:
- Xây dựng trung tâm dữ liệu AI-ready 100 MW cần vốn đầu tư tối thiểu 1 tỷ USD.
- Mỗi MW điện AI có thể tạo ra 1,5-2 triệu USD/năm doanh thu từ trung tâm dữ liệu và 15 triệu USD/năm từ GPU cloud.
- Các nhà đầu tư có thể xem xét các mô hình như REIT (quỹ tín thác bất động sản) để giảm chi phí tài chính.

📌 AI là cơ hội nghìn tỷ USD cho Đông Nam Á, có thể đóng góp 1 nghìn tỷ USD vào GDP khu vực vào năm 2030. Các chính phủ, doanh nghiệp và nhà đầu tư cần hành động ngay để xây dựng trung tâm dữ liệu và hạ tầng AI, nếu không sẽ bỏ lỡ cơ hội lớn. Các trung tâm dữ liệu AI-ready yêu cầu khoản đầu tư lớn, nhưng có khả năng tạo ra dòng tiền ổn định và mang lại lợi nhuận lâu dài. Chính phủ cần đảm bảo các chính sách rõ ràng về bảo mật dữ liệu và quyền riêng tư để thu hút các công ty công nghệ lớn. Đông Nam Á có thể trở thành trung tâm AI toàn cầu nếu tận dụng đúng tiềm năng về dữ liệu, GPU và hạ tầng.

https://www2.deloitte.com/id/en/pages/technology-media-and-telecommunications/articles/sea-ai-data-centres.html

Không có file đính kèm.

Nguồn tham khảo

103

AI chips-hardware-compute Semi-Cloud-DC-Green AI viễn thông 2025-03-14 10:27:43

4 bigtech rót 147 tỷ USD vào cơ sở hạ tầng AI trong năm 2025

CoreWeave đã ký kết thỏa thuận quan trọng với OpenAI trị giá lên đến 11,9 tỷ đô, nhằm tăng cường sức mạnh tính toán cho OpenAI trong việc huấn luyện và triển khai các mô hình tiên tiến. OpenAI cũng sẽ mua lại 350 triệu đô cổ phiếu của CoreWeave.
Michael Intrator, đồng sáng lập và CEO của CoreWeave nhấn mạnh vai trò ngày càng tăng của công ty trong lĩnh vực AI. Sam Altman, CEO của OpenAI cho biết CoreWeave bổ sung cho các quan hệ đối tác hiện có của OpenAI với Microsoft, Oracle và liên doanh Stargate với SoftBank.
CoreWeave được hậu thuẫn bởi Nvidia, đang chuẩn bị niêm yết trên sàn Nasdaq. Doanh thu của công ty tăng vọt hơn 700% trong năm 2024, đạt 1,92 tỷ đô, với Microsoft chiếm hơn 60% thu nhập.
Alibaba đã công bố khoản đầu tư lớn trị giá 380 tỷ nhân dân tệ (52,4 tỷ đô) vào AI và điện toán đám mây trong ba năm tới. Đây là khoản đầu tư tư nhân lớn nhất vào cơ sở hạ tầng điện toán tại Trung Quốc.
Eddie Wu Yongming, CEO của Alibaba nhấn mạnh ý định tăng cường chi tiêu vào AI và điện toán đám mây, phản ánh xu hướng toàn ngành hướng tới mở rộng dựa trên AI. Các nhà phân tích tin rằng khoản đầu tư này báo hiệu sự chuyển hướng của Alibaba vượt ra ngoài thương mại điện tử.
Tập đoàn viễn thông Pháp Iliad đã cam kết 3 tỷ euro (3,09 tỷ đô) cho cơ sở hạ tầng tập trung vào AI, chú trọng vào các trung tâm dữ liệu và sức mạnh tính toán. Công ty con OpCore của họ sẽ nhận được 2,5 tỷ euro để củng cố vị thế là nhà lãnh đạo châu Âu trong lĩnh vực trung tâm dữ liệu AI siêu quy mô.
Iliad đã hợp tác với công ty đầu tư tư nhân InfraVia, đảm bảo năng lực hàng trăm megawatt trong ngắn hạn, với kế hoạch mở rộng lên nhiều gigawatt trên khắp châu Âu.
Microsoft sẽ đầu tư 80 tỷ đô vào các trung tâm dữ liệu được thiết kế cho khối lượng công việc AI trong năm tài chính 2025, với hơn một nửa chi tiêu tập trung tại Hoa Kỳ.
Brad Smith, phó chủ tịch và chủ tịch của Microsoft nói: "Hoa Kỳ dẫn đầu cuộc đua AI toàn cầu nhờ vào vốn tư nhân và sự đổi mới từ các doanh nghiệp Mỹ thuộc mọi quy mô."
Các khoản đầu tư khổng lồ từ CoreWeave, Alibaba, Iliad và Microsoft cho thấy sự bùng nổ liên tục của cơ sở hạ tầng AI. Khi các ứng dụng AI ngày càng đòi hỏi sức mạnh tính toán cao hơn, cuộc cạnh tranh giành các trung tâm dữ liệu có khả năng mở rộng, hiệu suất cao đang trở nên gay gắt.

📌 Trong năm 2025, 4 tập đoàn công nghệ hàng đầu đã công bố đầu tư tổng cộng hơn 147 tỷ đô vào cơ sở hạ tầng AI. Microsoft dẫn đầu với 80 tỷ đô, Alibaba đầu tư 52,4 tỷ đô, CoreWeave cam kết 11,9 tỷ đô với OpenAI, và Iliad rót 3,09 tỷ đô xây dựng hạ tầng AI tại châu Âu.

https://www.rcrwireless.com/20250313/fundamentals/major-ai-infrastructure

Không có file đính kèm.

Nguồn tham khảo

112

Semi-Cloud-DC-Green AI chips-hardware-compute 2025-03-14 01:52:37

Cuộc đua xây dựng cỗ máy phức tạp nhất thế giới: Lật đổ ASML sẽ không dễ dàng

ASML, công ty Hà Lan có trụ sở gần Eindhoven, là nhà sản xuất duy nhất của máy quang khắc tiên tiến cần thiết để sản xuất chip AI hiện đại.
Thiết bị mới nhất của ASML là cỗ máy nặng 150 tấn, kích thước tương đương hai container vận chuyển và có giá khoảng 350 triệu USD.
Để ngăn Trung Quốc phát triển chip AI tiên tiến, Mỹ đã cấm ASML bán thiết bị tiên tiến nhất cho các nhà sản xuất chip Trung Quốc.
Trung Quốc đang đầu tư hàng tỷ đô la để phát triển công nghệ trong nước thay thế, trong khi Canon (Nhật Bản) đang đặt cược vào công nghệ đơn giản và rẻ hơn.
Máy EUV tiên tiến nhất của ASML hoạt động bằng cách bắn 50.000 giọt thiếc nóng chảy vào buồng chân không, tạo ra ánh sáng cực tím cực ngắn (EUV) có bước sóng 13,5nm.
Quá trình này tạo ra plasma nóng đạt nhiệt độ gần 220.000°C, nóng hơn khoảng 40 lần so với bề mặt mặt trời.
Ánh sáng được phản chiếu qua một loạt gương cực kỳ mịn (với độ không hoàn hảo đo bằng nghìn tỷ mét) để tạo ra mẫu mạch trên chip.
Công nghệ high-NA EUV mới nhất của ASML có thể in các chi tiết nhỏ tới 8nm, và công ty đang nghiên cứu công nghệ hyper-NA với khẩu độ trên 0,75.
Máy ASML là không thể thiếu cho sản xuất chip hiện đại, với các công ty như TSMC, Samsung và Intel đều phụ thuộc vào chúng.
Một chip hiện đại có thể chứa hơn 100 tỷ bóng bán dẫn, hơn 70 lớp và hơn 100km dây dẫn, tất cả trên miếng silicon khoảng 1,5 lần kích thước tem thư tiêu chuẩn.
Trung Quốc đang cố gắng tận dụng tối đa từ máy ASML cũ hơn (28nm trở lên) mà họ vẫn có thể nhập khẩu, sử dụng kỹ thuật in đa mẫu.
SMEE, công ty nhà nước Trung Quốc, đang phát triển máy có khả năng sản xuất chip 28nm sử dụng ánh sáng DUV, nhưng phát triển hệ thống EUV là thách thức hoàn toàn khác.
Canon đang đặt cược vào công nghệ quang khắc nanoimprint (NIL), một phương pháp in trực tiếp mẫu mạch lên tấm wafer, tương tự như máy in.
Canon ước tính phương pháp của họ rẻ hơn khoảng 40% so với máy tương đương từ ASML, nhưng vẫn phải đối mặt với những thách thức về khuyết tật, căn chỉnh và năng suất.
Sự đổi mới như vậy có thể giúp các công ty thiết kế chip nhanh hơn và tiết kiệm năng lượng hơn, có khả năng cung cấp năng lượng cho thế hệ mới của các mô hình AI.

📌 ASML hiện thống trị thị trường máy quang khắc chip tiên tiến với công nghệ EUV phức tạp có giá 350 triệu USD. Mặc dù Trung Quốc và Canon đang nỗ lực cạnh tranh, việc bắt kịp sẽ mất nhiều năm. Cuộc đua công nghệ này sẽ quyết định tương lai của điện toán, AI và công nghệ toàn cầu.

https://www.economist.com/science-and-technology/2025/03/12/the-race-is-on-to-build-the-worlds-most-complex-machine

Cuộc đua xây dựng cỗ máy phức tạp nhất thế giới
Lật đổ ASML sẽ không dễ dàng
Hai người mặc đồ bảo hộ trắng trong phòng sạch tại trụ sở của ASML ở Veldhoven, Hà Lan.
Ảnh: ASML
12 tháng 3 năm 2025

Ít ai có thể ngờ rằng tương lai của trí tuệ nhân tạo (AI) lại phụ thuộc vào Eindhoven, một thị trấn yên tĩnh của Hà Lan. Nhưng ngay bên ngoài ranh giới của thị trấn này là trụ sở của ASML, công ty duy nhất sản xuất các cỗ máy được gọi là công cụ quang khắc – những cỗ máy cần thiết để sản xuất các chip AI tiên tiến nhất. Sản phẩm mới nhất của ASML là một cỗ máy khổng lồ nặng 150 tấn, có kích thước bằng 2 container vận chuyển và có giá khoảng 350 triệu USD. Đây cũng là cỗ máy tiên tiến nhất đang được rao bán trên thị trường.

Năng lực của ASML đã đưa công ty trở thành trung tâm của cuộc chiến công nghệ toàn cầu. Để ngăn Trung Quốc sản xuất chip AI tiên tiến, Mỹ đã cấm ASML bán các thiết bị hiện đại nhất cho các nhà sản xuất chip Trung Quốc. Đáp lại, Trung Quốc đang rót hàng tỷ USD để xây dựng các giải pháp thay thế trong nước. Trong khi đó, Canon, một đối thủ đến từ Nhật Bản, đang đặt cược vào một công nghệ đơn giản và rẻ hơn để làm suy yếu vị thế thống trị của ASML. Tuy nhiên, khác với phần mềm, nơi vị thế lãnh đạo của ngành có thể thay đổi trong vài tháng, thành công trong lĩnh vực quang khắc là một cuộc đua chậm rãi được đo bằng hàng thập kỷ. Đánh bại ASML sẽ không hề dễ dàng. Cuộc đua này là để giành quyền kiểm soát cỗ máy sẽ định hình tương lai của máy tính, AI và công nghệ nói chung.

Cỗ máy tối tân của ASML

Cỗ máy tiên tiến nhất của ASML vô cùng phức tạp. Nó hoạt động bằng cách bắn 50.000 giọt thiếc nóng chảy vào một buồng chân không. Mỗi giọt nhận 2 cú đánh – đầu tiên từ một xung laser yếu làm dẹt giọt thiếc thành một chiếc "bánh kếp" nhỏ, sau đó là một xung laser mạnh làm bốc hơi nó. Quá trình này biến mỗi giọt thành plasma nóng, đạt nhiệt độ gần 220.000°C – nóng hơn bề mặt Mặt Trời khoảng 40 lần – và phát ra ánh sáng có bước sóng cực ngắn (cực tím cực sâu – EUV).

Ánh sáng này sau đó được phản xạ bởi một loạt các gương có độ nhẵn mịn tới mức sai lệch chỉ được đo bằng đơn vị phần nghìn tỷ mét. Các gương tập trung ánh sáng vào một mặt nạ hoặc khuôn chứa bản thiết kế của các mạch chip. Cuối cùng, tia sáng bật từ mặt nạ xuống một tấm silicon phủ hóa chất nhạy sáng, khắc thiết kế lên con chip.

Trò chơi công nghệ đỉnh cao

Các công cụ của ASML là thiết bị không thể thiếu để sản xuất chip hiện đại. Các công ty như TSMC, Samsung và Intel đều phụ thuộc vào chúng để sản xuất các bộ vi xử lý tiên tiến, từ bộ tăng tốc AI đến chip cho điện thoại thông minh. Không có công ty nào khác có thể sản xuất máy móc đủ khả năng in các chip có kích thước 7 nanomet (tỷ mét) hoặc nhỏ hơn (dù thuật ngữ này giờ đây chủ yếu được dùng cho mục đích tiếp thị hơn là để chỉ kích thước vật lý thực sự). Ngay cả với các công nghệ cũ hơn (14nm trở lên), các thiết bị của ASML vẫn chiếm hơn 90% thị phần.

Vi xử lý là một loại "lasagne điện tử" – một lớp bóng bán dẫn được phủ lên bằng các lớp dây đồng để truyền tải dữ liệu và năng lượng. Một bộ vi xử lý tiên tiến có thể chứa hơn 100 tỷ bóng bán dẫn, có hơn 70 lớp và hơn 100 km dây dẫn – tất cả đều nằm trên một miếng silicon có kích thước chỉ lớn hơn 1,5 lần con tem bưu chính.

Để chế tạo các tính năng nhỏ bé này, một cỗ máy quang khắc làm việc theo từng giai đoạn, khắc các mẫu bóng bán dẫn và dây dẫn kim loại lên tấm wafer, lớp này chồng lên lớp kia. Một tấm wafer đơn có thể chứa hàng trăm con chip.

Bí quyết thu nhỏ chip

Nguyên lý cơ bản của máy quang khắc của ASML giống như một chiếc máy chiếu phim cũ: ánh sáng đi qua một tấm khuôn để chiếu hình ảnh lên bề mặt. Kích thước nhỏ nhất mà một cỗ máy quang khắc có thể in phụ thuộc vào 2 yếu tố chính:

Bước sóng của ánh sáng – Bước sóng càng ngắn thì có thể tạo ra các chi tiết nhỏ hơn. Hệ thống cũ của ASML sử dụng ánh sáng cực tím sâu (DUV), có bước sóng từ 248nm đến 193nm, cho phép in các chi tiết nhỏ tới 38nm.
Khẩu độ số (NA) của gương – Khẩu độ số đo lượng ánh sáng mà gương có thể thu và tập trung. Các hệ thống mới nhất của ASML, gọi là EUV khẩu độ cao (high-NA EUV), sử dụng gương có khẩu độ 0,55, cho phép in các chi tiết nhỏ tới 8nm.

ASML đang nghiên cứu một công nghệ có tên hyper-NA, nâng khẩu độ lên hơn 0,75 mà vẫn sử dụng ánh sáng EUV hiện tại. Tuy nhiên, khẩu độ lớn hơn đòi hỏi các gương lớn hơn và nặng hơn, làm tăng chi phí và mức tiêu thụ điện năng.

Trung Quốc và Canon thách thức ASML

Trung Quốc, bị chặn tiếp cận các công cụ sản xuất chip tiên tiến nhất, đang cố gắng tận dụng tối đa các máy móc ASML cũ hơn (28nm trở lên). Một giải pháp là in nhiều lớp (multi-patterning), chia một mẫu thành nhiều lần khắc, cho phép in các chi tiết nhỏ hơn gấp 2 hoặc 4 lần.

Trong khi đó, Canon đang thử nghiệm một công nghệ mới có tên in nano (NIL) – giống như máy in. Canon cho rằng công nghệ này có thể tiết kiệm tới 40% chi phí so với hệ thống EUV của ASML. Tuy nhiên, NIL vẫn gặp phải các vấn đề về khuyết tật, căn chỉnh và tốc độ sản xuất.

Cuộc chiến thống trị ngành sản xuất chip

Công nghệ của Canon có thể sẽ tồn tại song song với EUV, đảm nhiệm các công đoạn đơn giản hơn và rẻ hơn. Tuy nhiên, ASML vẫn là người dẫn đầu trong ngành. Nếu ASML không cẩn thận, cỗ máy quan trọng nhất thế giới có thể sẽ mất đi vị thế thống trị trong tương lai. ■

The race is on to build the world’s most complex machine
But toppling ASML will not be easy
Two people dressed in white overall suits in the Cleanroom at ASML Headquarters in Veldhoven, Netherlands.
Photograph: ASML
Mar 12th 2025

Few would expect the future of artificial intelligence (AI) to depend on Eindhoven, a quiet Dutch town. Yet just beyond its borders sits the headquarters of ASML, the only company that makes the machines, known as lithography tools, needed to produce cutting-edge AI chips. ASML’s latest creation is a 150-tonne colossus, around the size of two shipping containers and priced at around $350m. It is also the most advanced machine for sale.
The firm’s expertise has placed it at the centre of a global technology battle. To prevent China from building whizzy AI chips, America has barred ASML from selling its most advanced gear to Chinese chipmakers. In response, China is pouring billions of dollars into building homegrown alternatives. Meanwhile, Canon, a Japanese rival, is betting on a simpler, cheaper technology to loosen ASML’s grip. Yet unlike software, where industry leadership can shift in months, success in lithography is a slow-moving race measured in decades. Overtaking ASML won’t be easy. At stake is control of the machine that will shape the future of computing, AI and technology itself.
ASML’s most advanced machine is mind-boggling. It works by firing 50,000 droplets of molten tin into a vacuum chamber. Each droplet takes a double hit—first from a weak laser pulse that flattens it into a tiny pancake, then from a powerful laser that vaporises it. The process turns each droplet into hot plasma, reaching nearly 220,000°C, roughly 40 times hotter than the surface of the Sun, and emits light of extremely short wavelength (extreme ultraviolet, or EUV). This light is then reflected by a series of mirrors so smooth that imperfections are measured in trillionths of a metre. The mirrors focus the light onto a mask or template that contains blueprints of the chip’s circuits. Finally the rays bounce from the mask onto a silicon wafer coated with light-sensitive chemicals, imprinting the design onto the chip.
High stakes
ASML’s tools are indispensable to modern chipmaking. Firms like TSMC, Samsung and Intel rely on them to produce cutting-edge processors, from AI accelerators to smartphone chips. No other company makes machines that can reliably print chips that are called “7 nanometres” (billionths of a metre) and below (though these terms once related to physical resolution, they are now primarily used for marketing). Even for more mature technologies (“14nm” and higher), the firm’s tools account for over 90% of the market.
A microchip is an electronic lasagne: a base of transistors topped with layers of copper wiring shuttling data and power. A leading-edge processor can pack over 100bn transistors, contain more than 70 layers and have more than 100 kilometres of wiring, all on a piece of silicon around one-and-half times the size of a standard postage stamp. To build these tiny features, a lithography machine works in stages by etching patterns of transistors and metal wires on a wafer, layer by layer. A single wafer can contain hundreds of chips.
ASML’s tool is complex, yet its basic principle is much like that of an old slide projector: light passes through a stencil to project an image onto a surface. The smallest feature an optical lithography tool can print depends mainly on two factors. The first is the wavelength of light. Just as a finer paintbrush allows for more detailed strokes, shorter wavelengths enable smaller patterns. ASML’s older systems used deep ultraviolet (DUV) light, with wavelengths between 248nm and 193nm, producing features as small as 38nm.
To shrink chip features even more, ASML turned to EUV light, with a wavelength of 13.5nm. Whereas EUV is naturally emitted in space by the solar corona, producing it on Earth is far trickier. EUV light is also completely absorbed by air, glass and most materials, so the process must be enclosed in a vacuum, using special mirrors to reflect and guide the light. ASML spent two decades perfecting the method that fires lasers at molten-tin droplets to create and generate this elusive beam.
The other dial that sets the smallest feature size is the numerical aperture (NA) of the mirrors, a measure of how much light they can collect and focus. ASML’s latest systems, called high-NA EUV, use mirrors with an aperture of 0.55, allowing it to print features on chips as small as 8nm. To go smaller still, the firm is studying what it calls hyper-NA by cranking the aperture up to more than 0.75 while still using existing EUV light. A higher NA means that the mirrors collect and focus light coming in from a broader range of angles, improving precision. This comes at a cost. Larger NAs require bigger mirrors to intercept and direct the expanded light paths. When ASML increased the NA of their machines from 0.33 to 0.55, the mirrors doubled in size and became ten times heavier, now weighing several hundred kilograms. Increasing the NA again will only add bulk, raising concerns about power consumption.
Another obstacle is pricing. ASML does not disclose precise figures, but its latest EUV machine was almost twice as expensive as its predecessor. A hyper-NA system would be dearer still. Though the company cautions that there are no guarantees of it ever being produced, Jos Benschop, ASML’s head of technology, believes a hyper-NA machine could arrive within the next five to ten years, pending demand.
Some researchers are already planning to go beyond EUV light, aiming for wavelengths of around 6nm. This would require breakthroughs in light sources, optics and photoresist (the light-sensitive coating on wafers). Shorter wavelengths also bring new challenges, including “shot noise”, or random particle movements that blur patterns. But Yasin Ekinci of the Paul Scherrer Institute, a Swiss research centre, sees this as a “plan B” if hyper-NA fails to deliver.
While ASML pushes the boundaries of optical lithography, China—cut off from the most advanced chipmaking tools—is trying to extract more from the older ASML machines (capable of 28nm and above) it can still import. One approach is multi-patterning, in which a pattern is broken into multiple etching stages, allowing a machine to print details twice or four times as small. Multi-patterning is effective, but adds complexity and slows production.
China is also trying to build its own lithography tools. SMEE, a state-owned firm, is reportedly making progress on a machine capable of producing 28nm chips using DUV light. But developing an EUV system is an entirely different challenge. Jeff Koch of SemiAnalysis, a research firm, points out that beyond mastering EUV light itself, China would need to replicate ASML’s vast supply chain, stretching to more than 5,000 specialised suppliers.
ASML’s dominance in high-end lithography, therefore, seems unshakable. But Canon, once an industry leader, is betting on an alternative. Nanoimprint lithography (NIL) stamps circuit patterns directly onto wafers, much like a printing press. In theory, NIL could create features with nanometre accuracy, offering a low-cost, compact rival to ASML’s EUV machines.
The NIL process begins with the creation of a master mask which has the template of the circuit etched onto it by an electron beam. Next, droplets of a liquid resin are applied to the wafer before a mask presses the circuit pattern onto the wafer. Ultraviolet light is then used to solidify the resin and form the circuit patterns, after which the mask is removed. This step is repeated for every layer of the chip. Canon estimates that its approach costs around 40% less than a comparable machine from ASML.
For NIL to become a mainstream chipmaking technology, it must overcome several challenges. Defects are a big concern—tiny particles or imperfections on the mould can create repeating flaws across entire wafers. Alignment is another hurdle. Since chips are built in layers, the circuit patterns of every layer must line up precisely. Any variation in wafer flatness or slight misalignment between the mould and wafer can cause nanoscale errors, disrupting electrical connections. Canon claims its system achieves nanometre precision, but maintaining this consistently during production is difficult. Then there is throughput, or how many wafers a machine can process per hour. ASML’s high-NA EUV tools can handle over 180 wafers per hour, with some older models reaching nearly twice that. In contrast, Canon’s latest NIL system manages only 110 wafers per hour, making it less suited for high-volume chip production—at least for now.
So far NIL has found more success outside semiconductor manufacturing, particularly in making smartphone displays and other high-precision components. The technology is now making inroads into memory-chip production, where higher defect rates are more tolerable than in logic chips. Iwamoto Kazunori, the head of Canon’s optical division, believes that NIL can co-exist with EUV lithography, cheaply performing manufacturing steps where it can and steering clear of finer detail.
Such innovation could help firms design faster and more energy-efficient chips capable of powering a new generation of AI models. If ASML is not careful, the world’s most important machine may not keep its title for ever. ■

Không có file đính kèm.

Nguồn tham khảo

112

AI chips-hardware-compute 2025-03-14 01:34:22

Huawei Ascend 910C đang thách thức thị trường chip AI với hiệu suất đạt 80% so với Nvidia H100

Huawei Ascend 910C là chip AI mới nhất của Huawei với những cải tiến vượt trội so với các phiên bản tiền nhiệm, đang được chuẩn bị cho sản xuất hàng loạt.
Theo tiết lộ từ nhà phân tích @ohlennart trên nền tảng X, Ascend 910C sẽ sử dụng phương pháp kết hợp hai SoC Ascend 910B thông qua hai silicon interposer khác nhau được kết nối qua chất nền hữu cơ.
Phương pháp này sẽ dẫn đến băng thông die-to-die thấp hơn 10-20 lần so với chip Nvidia H100, nhưng đây là kỹ thuật đơn giản để sản xuất các SoC AI hiệu quả.
Con chip mới dự kiến đạt hiệu suất 800 TFLOP/s ở FP16 với băng thông bộ nhớ khoảng 3,2 TB/s, tương đương khoảng 80% hiệu suất của Nvidia H100.
Huawei sẽ sử dụng công nghệ quy trình 7nm để sản xuất Ascend 910C, dựa vào lượng lớn chip quy trình 7nm từ TSMC mà công ty đã tích trữ trước khi các hạn chế của Mỹ có hiệu lực vào năm 2019.
SMIC, nhà sản xuất chip Trung Quốc, hiện có khả năng sản xuất 50.000 wafer mỗi tháng và cũng sẽ đóng góp công nghệ quy trình 7nm trong việc sản xuất Ascend 910C.
Ascend 910C đã được sử dụng trong DeepSeek R1 và đang chuẩn bị bước vào sản xuất hàng loạt, thể hiện nỗ lực của Huawei nhằm cung cấp giải pháp thay thế mạnh mẽ cho các chip AI của Nvidia cho khách hàng Trung Quốc.
Theo nguồn tin, một số hoặc có thể tất cả các chip này không được sản xuất trong nước mà đã được mua lậu từ TSMC bất chấp các biện pháp kiểm soát xuất khẩu.
Huawei đang nỗ lực không ngừng để trở thành giải pháp thay thế tốt nhất cho các chip AI của Nvidia trong bối cảnh căng thẳng địa chính trị và hạn chế công nghệ.

📌 Huawei Ascend 910C đang thách thức thị trường chip AI với hiệu suất đạt 80% so với Nvidia H100, sử dụng công nghệ 7nm từ TSMC và SMIC. Chiến lược kết hợp hai SoC 910B tạo ra sức mạnh xử lý 800 TFLOP/s, đánh dấu bước tiến quan trọng của Trung Quốc trong việc phát triển công nghệ chip độc lập.

https://www.huaweicentral.com/huawei-ascend-910c-alleged-specs-suggest-it-a-tough-rival-to-nvidia-h100/

Không có file đính kèm.

Nguồn tham khảo

115

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-03-12 00:43:55

Kế hoạch 20 tỷ USD của Ủy ban châu Âu nhằm xây dựng 4 "nhà máy khổng lồ AI"

Ủy ban châu Âu đang huy động 20 tỷ USD để xây dựng 4 "nhà máy khổng lồ AI" nhằm theo kịp Mỹ và Trung Quốc, tuy nhiên nhiều chuyên gia ngành công nghiệp nghi ngờ về tính khả thi của kế hoạch này.
Kế hoạch xây dựng các trung tâm dữ liệu công cộng quy mô lớn này đối mặt với nhiều thách thức từ việc mua chip, tìm địa điểm phù hợp đến nguồn điện cung cấp.
Mục tiêu là tạo điều kiện cho các công ty địa phương như startup Mistral của Pháp (được Nvidia hỗ trợ) phát triển và sử dụng cơ sở hạ tầng này để tạo ra các mô hình AI hoạt động theo quy định an toàn AI và bảo vệ dữ liệu của EU.
Mỗi nhà máy khổng lồ AI sẽ chứa 100.000 chip "tiên tiến", lớn hơn 4 lần so với siêu máy tính lớn nhất đang được xây dựng ở EU (dự án Jupiter tại Đức).
Nvidia bán các chip GPU tiên tiến cần thiết để huấn luyện AI với giá khoảng 40.000 USD mỗi chip – ám chỉ chi phí vài tỷ euro cho mỗi nhà máy khổng lồ.
Quy mô này vẫn nhỏ hơn các dự án được công bố bởi các công ty Mỹ, ví dụ như Meta đang chi 10 tỷ USD để xây dựng cơ sở 1,3 triệu GPU ở Louisiana với công suất điện 1,5 gigawatt.
Kevin Restivo từ công ty tư vấn trung tâm dữ liệu CBRE cho biết nhà máy khổng lồ sẽ đối mặt với các vấn đề tương tự như các dự án tư nhân ở châu Âu: khó khăn trong việc mua chip Nvidia và thiếu điện theo quy mô cần thiết.
Chính phủ Mỹ dưới thời cựu Tổng thống Biden đã hạn chế việc tiếp cận chip AI để ngăn chặn việc xây dựng nhà máy khổng lồ ở nhiều quốc gia châu Âu.
Bertin Martens từ tổ chức nghiên cứu kinh tế Bruegel cho rằng không hợp lý khi chi tiêu công tham gia vào cuộc đua chi tiêu AI vì "tuổi thọ của các nhà máy như vậy, trước khi bạn phải xóa sổ và mua chip Nvidia mới, là khoảng... một năm rưỡi".
Song song với kế hoạch nhà máy khổng lồ, Ủy ban cũng đang nâng cấp 12 trung tâm siêu máy tính khoa học để biến chúng thành nhà máy AI.

📌 Kế hoạch xây dựng bốn nhà máy khổng lồ AI trị giá 20 tỷ USD của EU đối mặt nhiều thách thức từ nguồn cung chip, điện năng đến tuổi thọ ngắn của trung tâm dữ liệu. Dù tham vọng, nhưng quy mô vẫn nhỏ hơn dự án 10 tỷ USD của Meta tại Mỹ, đặt ra câu hỏi về hiệu quả của chiến lược đuổi kịp công nghệ AI.

https://www.reuters.com/technology/artificial-intelligence/if-europe-builds-gigafactories-will-an-ai-industry-come-2025-03-11/

Không có file đính kèm.

Nguồn tham khảo

100

AI chips-hardware-compute 2025-03-12 00:26:57

Meta đang thử nghiệm chip AI tự phát triển đầu tiên nhằm giảm sự phụ thuộc vào Nvidia

Meta đang thử nghiệm chip đào tạo AI (training chip) đầu tiên do công ty tự phát triển, đánh dấu một cột mốc quan trọng trong kế hoạch giảm sự phụ thuộc vào nhà cung cấp bên ngoài như Nvidia.
Chip mới đang được triển khai thử nghiệm quy mô nhỏ và Meta có kế hoạch tăng cường sản xuất để sử dụng rộng rãi nếu thử nghiệm thành công.
Đây là một phần trong chiến lược dài hạn của Meta nhằm giảm chi phí cơ sở hạ tầng khi công ty đang đặt cược lớn vào các công cụ AI để thúc đẩy tăng trưởng.
Meta dự kiến tổng chi phí năm 2025 lên tới 114-119 tỷ USD, trong đó có tới 65 tỷ USD chi tiêu vốn chủ yếu dành cho cơ sở hạ tầng AI.
Chip đào tạo mới của Meta là một bộ tăng tốc chuyên dụng, được thiết kế chỉ để xử lý các tác vụ AI cụ thể, giúp tiết kiệm năng lượng hơn so với các GPU tích hợp thông thường.
Meta đang hợp tác với nhà sản xuất chip Đài Loan TSMC để sản xuất chip này, sau khi hoàn thành quá trình "tape-out" đầu tiên - một dấu hiệu thành công quan trọng trong phát triển chip silicon.
Chip này là phiên bản mới nhất trong dòng Meta Training and Inference Accelerator (MTIA) của công ty, một chương trình từng có khởi đầu không ổn định và đã từng hủy bỏ một dự án chip ở giai đoạn phát triển tương tự.
Năm ngoái, Meta đã bắt đầu sử dụng chip MTIA để thực hiện suy luận (inference) cho hệ thống đề xuất quyết định nội dung xuất hiện trên bảng tin Facebook và Instagram.
Các lãnh đạo Meta đã tuyên bố họ muốn bắt đầu sử dụng chip của riêng mình vào năm 2026 cho quá trình đào tạo AI.
Mục tiêu ban đầu là sử dụng chip mới cho hệ thống đề xuất, sau đó mở rộng sang các sản phẩm AI tạo sinh như chatbot Meta AI.
Giám đốc sản phẩm Chris Cox mô tả nỗ lực phát triển chip của Meta là tình huống "đi, bò, chạy", nhưng cho biết chip suy luận thế hệ đầu tiên cho hệ thống đề xuất là một "thành công lớn".
Meta vẫn là một trong những khách hàng lớn nhất của Nvidia, đã đầu tư hàng tỷ đô la vào GPU của Nvidia từ năm 2022 sau khi từng hủy bỏ dự án chip suy luận tự phát triển trước đó.

📌 Meta đang thử nghiệm chip AI đầu tiên tự phát triển, hợp tác với TSMC để sản xuất, nhằm giảm chi phí và sự phụ thuộc vào Nvidia. Dự kiến triển khai rộng rãi từ 2026 nếu thành công, ban đầu cho hệ thống đề xuất, sau đó mở rộng sang AI tạo sinh.

https://www.reuters.com/technology/artificial-intelligence/meta-begins-testing-its-first-in-house-ai-training-chip-2025-03-11/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute AI mở-nguồn mở 2025-03-10 21:00:51

Alibaba tiếp tục thúc đẩy sự tự chủ công nghệ của Trung Quốc với chip RISC-V mới XuanTie C930

Alibaba Group Holding vừa ra mắt bộ vi xử lý XuanTie C930 cấp máy chủ, mang lại động lực mới cho ngành công nghiệp bán dẫn Trung Quốc và mở rộng việc sử dụng chip nguồn mở trong nước.
Bộ vi xử lý này được phát triển bởi Damo Academy - bộ phận nghiên cứu của Alibaba và đơn vị bán dẫn T-Head, nhắm đến các ứng dụng tính toán hiệu năng cao như máy chủ trung tâm dữ liệu và xe tự lái.
XuanTie C930 được thiết kế dựa trên kiến trúc tập lệnh RISC-V, một nền tảng nguồn mở giúp Trung Quốc đối phó với các hạn chế công nghệ từ Mỹ.
Sản phẩm sẽ bắt đầu giao cho khách hàng vào tháng 3/2025, với thiết kế CPU có thể cấp phép cho các nhà phát triển mạch tích hợp (IC).
Theo Ni Guangnan, học giả Viện Kỹ thuật Trung Quốc, mô hình nguồn mở sẽ giúp xây dựng hệ sinh thái RISC-V toàn cầu mang tính hòa nhập và hợp tác, trở thành động lực mới cho sự đột phá trong ngành công nghiệp chip.
Sáng kiến nguồn mở này không chỉ thể hiện tiến bộ của Alibaba trong thiết kế chip RISC-V trong những năm gần đây, mà còn phản ánh cam kết của Trung Quốc trong việc vượt qua các lệnh trừng phạt từ Mỹ.
Các hạn chế thương mại của Mỹ đã cắt giảm khả năng tiếp cận của Trung Quốc với công nghệ bán dẫn tiên tiến và thiết bị sản xuất chip, trong bối cảnh nhu cầu ngày càng tăng từ các dự án phát triển trí tuệ nhân tạo (AI) trong nước.
XuanTie C930 được kỳ vọng sẽ mở đường cho nhiều đổi mới chip nguồn mở hơn nữa tại Trung Quốc, góp phần vào nỗ lực tự chủ công nghệ của quốc gia này.

📌 Alibaba đã tạo bước đột phá với chip RISC-V XuanTie C930 nhắm vào ứng dụng máy chủ và xe tự lái. Sản phẩm nguồn mở này sẽ bắt đầu giao hàng từ tháng 3/2025, phản ánh chiến lược của Trung Quốc nhằm vượt qua lệnh cấm công nghệ Mỹ và phát triển ngành công nghiệp bán dẫn tự chủ.

https://www.scmp.com/tech/big-tech/article/3301620/how-alibabas-new-risc-v-chip-hits-mark-chinas-tech-self-sufficiency-drive

Không có file đính kèm.

Nguồn tham khảo

127

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-03-10 01:50:36

Mối quan hệ giữa AI và trung tâm dữ liệu

Sự phát triển của ứng dụng AI đã tạo ra nhu cầu chưa từng có về năng lực tính toán hiệu suất cao, đặt trung tâm dữ liệu vào vị trí then chốt của cuộc cách mạng kỹ thuật số.
Trung tâm dữ liệu đóng vai trò là xương sống của điện toán hiện đại, hỗ trợ từ dịch vụ đám mây doanh nghiệp đến các mô hình AI phức tạp, được trang bị máy chủ mạnh mẽ, phần cứng mạng và hệ thống lưu trữ.
Machine learning và deep learning đòi hỏi bộ xử lý chuyên biệt như GPU, TPU và các bộ tăng tốc AI tùy chỉnh, cùng với hệ thống làm mát hiệu quả để quản lý nhiệt lượng sinh ra.
Các gã khổng lồ công nghệ như Google, Microsoft, Amazon, Meta và NVIDIA đang đầu tư hàng tỷ đô vào việc xây dựng trung tâm dữ liệu hyperscale sẵn sàng cho AI trên toàn cầu.
Điện toán biên đang đóng vai trò ngày càng quan trọng trong các ứng dụng AI thời gian thực, mang sức mạnh tính toán đến gần hơn với người dùng cuối, giảm độ trễ cho các công nghệ như xe tự hành, thành phố thông minh và thiết bị IoT.
Theo ước tính, các khối lượng công việc AI có thể tiêu thụ tới 20% lượng điện toàn cầu vào năm 2030 nếu không áp dụng giải pháp bền vững.
Các công ty đang đầu tư vào trung tâm dữ liệu sử dụng năng lượng tái tạo, khám phá lò phản ứng hạt nhân mô-đun nhỏ và triển khai tối ưu hóa năng lượng bằng AI.
Chính AI đang được sử dụng để tối ưu hóa hoạt động trung tâm dữ liệu thông qua hệ thống làm mát, bảo trì dự đoán và phân phối khối lượng công việc, giúp giảm mức tiêu thụ năng lượng lên tới 40%.
Công nghệ AI đang thúc đẩy phần cứng chuyên biệt như TPU, chip neuromorphic và điện toán lượng tử để tăng tốc độ xử lý.
Xu hướng Data Center as a Service (DCaaS) đang phát triển, cho phép doanh nghiệp thuê tài nguyên điện toán được tối ưu hóa cho AI thay vì xây dựng cơ sở hạ tầng riêng.
Ngành công nghiệp trung tâm dữ liệu đang chuyển sang thiết kế mô-đun và tự duy trì, bao gồm trung tâm dữ liệu dưới nước sử dụng nước biển để làm mát và lưới điện micro sử dụng nguồn năng lượng tái tạo.

📌 Cuộc bùng nổ AI đang định hình lại trung tâm dữ liệu với tiêu thụ điện dự kiến đạt 20% toàn cầu vào 2030. Giải pháp bao gồm hyperscale, điện toán biên, năng lượng tái tạo và chip chuyên dụng, tạo nên hệ sinh thái kỹ thuật số thông minh, hiệu quả và tự duy trì.

https://www.eurasiareview.com/07032025-the-ai-boom-and-the-future-of-data-centers-how-artificial-intelligence-is-reshaping-digital-infrastructure-analysis/

Không có file đính kèm.

Nguồn tham khảo

139

AI chips-hardware-compute 2025-03-06 23:59:00

Nhà sản xuất công nghệ Trung Quốc đẩy mạnh máy chủ AI "all-in-one" sử dụng mô hình DeepSeek

Doanh thu toàn bộ thị trường máy chủ AI trong nước dự kiến đạt 54 tỷ nhân dân tệ (7,4 tỷ USD) vào năm 2025.
Hơn 30 nhà sản xuất máy chủ Trung Quốc sản xuất các máy chủ nhúng mô hình AI DeepSeek.
Các công ty như Lenovo, Huawei và Inspur dẫn đầu trong việc cung cấp máy chủ AI “all-in-one” cho doanh nghiệp.
Khoảng 5% nhu cầu máy chủ AI đến từ các ngành công nghiệp nhạy cảm như chính phủ, tài chính, dịch vụ công và chăm sóc sức khỏe.
Những máy chủ này cho phép doanh nghiệp triển khai ứng dụng AI dễ dàng và nhanh chóng mà không cần nhiều tài nguyên kỹ thuật.
Sự phổ biến của máy chủ AI DeepSeek đến từ khả năng triển khai tại các trung tâm dữ liệu của doanh nghiệp, đảm bảo an ninh cho dữ liệu nhạy cảm.
Sự phát triển nhanh chóng của công nghệ DeepSeek cho thấy khả năng tiếp cận AI ngày càng tăng đối với nhiều doanh nghiệp.

📌 Nhu cầu máy chủ AI "all-in-one" DeepSeek ngày càng gia tăng ở Trung Quốc, với doanh thu ước tính đạt 7,4 tỷ USD vào năm 2025. Các nhà sản xuất như Inspur, Huawei và Lenovo đang chiếm lĩnh thị trường với các sản phẩm dễ sử dụng và bảo mật cao cho doanh nghiệp.

https://www.scmp.com/tech/tech-trends/article/3301347/chinese-tech-firms-huawei-inspur-push-all-one-deepseek-ai-servers

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-03-06 23:49:05

Máy tính sinh học đầu tiên thế giới sử dụng tế bào não người ra mắt thương mại

Cortical Labs giới thiệu CL1 - máy tính AI đầu tiên kết hợp tế bào não người thật với phần cứng silicon, được ra mắt thương mại như "máy tính sinh học thương mại hóa đầu tiên trên thế giới"
CL1 chứa hàng trăm nghìn tế bào thần kinh người nuôi cấy trong phòng thí nghiệm từ tế bào gốc lấy từ mẫu máu
Các tế bào thần kinh này tạo thành mạng lưới trên "chip" silicon và giao tiếp với hệ thống máy tính, cho phép nhận dữ liệu, xử lý thông tin và tạo ra đầu ra thông qua mô hình kích hoạt thần kinh
Ưu điểm chính là khả năng học nhanh của tế bào thần kinh, có thể suy luận trực quan từ dữ liệu hạn chế nhanh hơn AI hiện tại
CL1 tiêu thụ chỉ vài watt điện, hiệu quả năng lượng hơn so với các mô hình AI điển hình
Cortical Labs cung cấp CL1 dưới dạng "Wetware-as-a-Service" (WaaS), cho phép khách hàng thuê thời gian sử dụng chip và truy cập từ xa như đám mây
Công ty đang tham khảo ý kiến các chuyên gia về đạo đức sinh học để giải quyết các lo ngại về ý thức hoặc nhận thức của các tế bào này
Một số chuyên gia cảnh báo rằng các lớp tế bào thần kinh 2D của công ty vẫn còn tương đối đơn giản so với mạng lưới phức tạp trong não người

📌 CL1 là máy tính sinh học thương mại đầu tiên sử dụng tế bào não người, tiêu thụ chỉ vài watt điện. Cortical Labs cung cấp dịch vụ WaaS cho phép thuê thời gian sử dụng chip từ xa, mở ra tiềm năng ứng dụng trong nghiên cứu y tế và điện toán siêu tiết kiệm năng lượng.

https://www.techspot.com/news/107042-world-first-commercial-biological-computer-powered-human-brain.html

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-03-06 23:39:33

Cách các nhà cung cấp hạ tầng GPU có thể chuyển đổi thành công ty AI toàn diện

Nhà cung cấp hạ tầng GPU đang đối mặt với thời điểm quan trọng khi AI tái định hình các ngành công nghiệp.
Cạnh tranh gia tăng và tỷ lệ sử dụng biến động đòi hỏi sự phát triển từ nhà cung cấp cơ sở hạ tầng thuần túy thành nhà cung cấp dịch vụ AI toàn diện.
Việc mở rộng theo chiều dọc sang dịch vụ toàn diện giúp tăng cường sử dụng GPU và tiếp cận các nguồn doanh thu có biên lợi nhuận cao hơn.
Con đường phát triển chiến lược bao gồm: môi trường phát triển AI, dịch vụ quản lý mô hình, khả năng tinh chỉnh, trợ lý AI doanh nghiệp và tác nhân AI tự trị.
Môi trường phát triển AI tích hợp cung cấp điểm truy cập dễ dàng cho các nhà khoa học dữ liệu.
Dịch vụ quản lý mô hình tối đa hóa việc sử dụng GPU thông qua phục vụ mô hình hiệu quả.
Khả năng tinh chỉnh cho phép tùy chỉnh trong khi duy trì mức sử dụng tài nguyên cao.
Trợ lý AI doanh nghiệp tạo ra doanh thu định kỳ bền vững thông qua triển khai toàn doanh nghiệp.
Tác nhân AI tự trị thực hiện các tác vụ và quy trình làm việc phức tạp.
Thách thức triển khai bao gồm: xây dựng nền tảng vững chắc, tập trung vào bảo mật và xây dựng quan hệ đối tác chiến lược.
CoreWeave đã đối mặt với những thách thức đáng kể khi phát triển từ nhà cung cấp tập trung vào GPU sang nhà cung cấp dịch vụ AI.
Chiến lược chuyển đổi theo lớp cung cấp cải thiện sử dụng tài nguyên, biên lợi nhuận cao hơn và ổn định doanh thu.

📌 Chuyển đổi từ nhà cung cấp cơ sở hạ tầng GPU thành công ty dịch vụ AI toàn diện là chiến lược sống còn. Các công ty nhanh chóng xây dựng và triển khai dịch vụ giá trị cao hơn sẽ nổi lên như những nhà lãnh đạo trong giai đoạn tiếp theo của việc áp dụng AI doanh nghiệp, nắm bắt cơ hội định hình tương lai của dịch vụ AI doanh nghiệp.

https://www.forbes.com/councils/forbestechcouncil/2025/03/06/how-gpu-infrastructure-providers-can-transform-into-full-stack-ai-companies/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-03-02 11:17:16

DeepSeek ra mắt hệ thống tệp 3FS nguồn mở đạt tốc độ đọc 7,3 TB/giây

DeepSeek AI đã phát hành hệ thống tệp tin song song Fire-Flyer File System (3FS) hoàn toàn nguồn mở trong sự kiện Open Source Week.
3FS là hệ thống tệp tin song song dựa trên Linux được thiết kế đặc biệt cho hoạt động AI-HPC, nơi các máy chủ lưu trữ dữ liệu liên tục được truy cập bởi các nút GPU để đào tạo các mô hình ngôn ngữ lớn (LLM).
Đặc điểm độc đáo của 3FS là ưu tiên tối đa tốc độ đọc ngẫu nhiên và gần như hoàn toàn bỏ qua bộ đệm đọc (read caching).
Khi đào tạo mô hình AI, các đơn vị tính toán cần truy cập dữ liệu đào tạo ngẫu nhiên liên tục, và việc đọc dữ liệu này chỉ diễn ra một lần duy nhất.
DeepSeek đã sử dụng 3FS để tổ chức máy chủ của mình từ ít nhất năm 2019.
Trong hệ thống cụm của DeepSeek, 3FS đạt được tốc độ đọc tổng hợp lên tới 7,3 TB/giây.
Trong cụm Fire-Flyer 2, DeepSeek đã sử dụng 180 nút lưu trữ, mỗi nút được trang bị 16 ổ SSD 16TB và hai NIC 200Gbps, phục vụ 10.000 GPU Nvidia A100 PCIe.
DeepSeek tuyên bố 3FS đạt hiệu suất đo được là 6,6 TB/giây, trong khi vẫn chạy các tác vụ đào tạo trong nền bổ sung thêm 1,4 TB/giây tốc độ đọc.
So sánh với hệ thống tệp tin đối thủ Ceph chỉ đạt tốc độ đọc 1,1 TB/giây (trên máy chủ 68 nút, 10 SSD 16TB và kết nối mạng 2 x 100 Gbps) lần đầu tiên vào đầu năm 2024.
3FS được đánh giá là phần quan trọng trong bộ phần mềm của DeepSeek để đào tạo DeepSeek AI, giúp giải pháp Fire-Flyer 2 HPC đạt 80% hiệu suất của giải pháp máy chủ DGX-A100 của Nvidia với chỉ 50% giá thành và 60% mức tiêu thụ điện năng.
Người dùng quan tâm có thể tải 3FS từ trang Github của DeepSeek, mặc dù có thể phải đối mặt với một số lo ngại về công nghệ từ Trung Quốc.

📌 DeepSeek đã phát hành hệ thống tệp tin Fire-Flyer (3FS) nguồn mở đạt tốc độ đọc 7,3 TB/giây, tối ưu cho đào tạo AI với ưu tiên đọc ngẫu nhiên thay vì bộ đệm. Hệ thống đã giúp giảm 50% chi phí và 40% điện năng so với giải pháp Nvidia, mở ra tiềm năng lớn cho cả người dùng cá nhân và doanh nghiệp.

https://www.tomshardware.com/pc-components/storage/deepseek-releases-powerful-new-parallel-file-system-fire-flyer-fire-system-made-open-source

Không có file đính kèm.

Nguồn tham khảo

STI AI chips-hardware-compute 2025-02-28 23:50:29

Trung Quốc bất ngờ thay thế "ông trùm quản lý công nghệ" đứng sau chiến lược chip và AI quốc gia

Trung Quốc đã đột ngột thay thế người đứng đầu công nghệ quốc gia Jin Zhuanglong (Kim Trang Long), người giám sát nỗ lực xây dựng ngành công nghiệp chip đẳng cấp thế giới và cạnh tranh với Mỹ trong lĩnh vực công nghệ cao.
Kim Trang Long, chuyên gia hàng không vũ trụ 60 tuổi, không còn được liệt kê là bí thư đảng của Bộ Công nghiệp và Công nghệ thông tin, sau khi ông biến mất khỏi công chúng vào tháng 12/2024, làm dấy lên đồn đoán về vị trí của ông.
Bộ Công nghiệp và Công nghệ thông tin, cơ quan giám sát các lĩnh vực từ nỗ lực phát triển chip đến vấn đề dư thừa công suất trong xe điện, thông báo hôm thứ Sáu rằng Li Lecheng hiện đảm nhận vai trò đó, không đưa ra lý do cho sự thay đổi này.
Li Lecheng, 60 tuổi, đã làm tỉnh trưởng Liêu Ninh từ năm 2022.
Kim Trang Long vẫn được liệt kê là Bộ trưởng Công nghiệp và Công nghệ thông tin quốc gia, mặc dù chưa đến tuổi nghỉ hưu. Việc bãi nhiệm chức danh này đòi hỏi phải có sự phê chuẩn của cơ quan lập pháp cao nhất, và có thể được công bố tại cuộc họp quốc hội thường niên vào tuần tới.
Chủ tịch Tập Cận Bình đã loại bỏ 3 bộ trưởng đương nhiệm kể từ khi công bố nội các mới nhất vào năm 2023, trong chiến dịch thanh lọc rộng khắp Đảng Cộng sản. Đợt thanh trừng này đã dẫn đến việc loại bỏ cựu Ngoại trưởng Tần Cương, cựu Bộ trưởng Quốc phòng Lý Thượng Phúc và cựu Bộ trưởng Nông nghiệp Đường Nhân Kiến. Chưa rõ việc loại bỏ Jin có liên quan đến tham nhũng hay không.
Long từng là chỉ huy trưởng của máy bay chở khách thân rộng đầu tiên của Trung Quốc, sau đó được bổ nhiệm làm phó giám đốc điều hành của ủy ban trung ương phụ trách hội nhập quân sự-dân sự vào năm 2017.
Ông thay thế Tiêu Á Thanh vào năm 2022 sau khi người tiền nhiệm bị mất chức vì nhận hối lộ. Tiêu cuối cùng đã bị giáng chức và nghỉ hưu, theo cơ quan chống tham nhũng hàng đầu của đất nước.
Bộ của Long điều tiết các ngành công nghiệp nặng, ô tô, viễn thông và điện tử của đất nước. Tháng 11/2024, Jin đã gặp Giám đốc điều hành Apple Inc., Tim Cook tại Bắc Kinh, thúc giục công ty tiếp tục đầu tư nhiều hơn vào đổi mới tại Trung Quốc.

📌 Trung Quốc bất ngờ thay thế Jin Zhuanglong (Kim Trang Long) khỏi vị trí bí thư đảng tại Bộ Công nghiệp và Công nghệ thông tin, mặc dù ông vẫn giữ chức bộ trưởng. Đây là trường hợp thứ tư trong loạt thay đổi nhân sự cấp cao dưới thời Tập Cận Bình kể từ 2023, phản ánh chiến dịch thanh lọc đang diễn ra trong nội bộ Đảng Cộng sản Trung Quốc.

https://www.bloomberg.com/news/articles/2025-02-28/china-abruptly-replaces-tech-czar-behind-ai-and-chip-push

Không có file đính kèm.

Nguồn tham khảo

106

AI chips-hardware-compute 2025-02-28 23:32:55

CEO Nvidia Jensen Huang: Tất cả đang "chạy đua" để áp dụng công nghệ AI

Tổng giám đốc Nvidia Jensen Huang trong cuộc phỏng vấn với chương trình "The Claman Countdown" đã khẳng định "tất cả" đang "chạy đua" để áp dụng công nghệ trí tuệ nhân tạo.
Tốc độ áp dụng AI diễn ra "cực kỳ nhanh chóng" trong nhóm các nhà phát triển công nghệ cốt lõi, nhà xây dựng mô hình và các công ty đang phát triển AI hướng đến người tiêu dùng.
Huang nhấn mạnh các mô hình tiên tiến và các startup đang nỗ lực xây dựng thế hệ tiếp theo của mô hình tiên phong, họ đang "đua" để đạt đến cấp độ tiếp theo.
AI tác nhân (Agentic AI) đang "phát triển rất tốt" và nhiều khả năng sẽ xuất hiện tiếp theo, sau đó sẽ là AI vật lý - loại AI hiểu biết các quy luật vật lý như quán tính, trọng lực và nhân quả.
AI vật lý sẽ được ứng dụng cho xe tự lái, hệ thống robot và các lĩnh vực tương tự, các ngành công nghiệp này "đang xuất hiện theo từng đợt" và "xây dựng dựa trên nhau".
Về trung tâm dữ liệu, chi tiêu vốn đang cho thấy "tăng trưởng mạnh mẽ" so với năm ngoái, không chỉ tổng chi tiêu lớn hơn mà phần dành cho AI sẽ cao hơn nhiều.
Tổng giám đốc Nvidia dự đoán còn "nhiều năm xây dựng phía trước" để phát triển các trung tâm dữ liệu thành "nhà máy AI", biến năng lượng thành trí tuệ số.
Khi được hỏi về DeepSeek - một startup Trung Quốc đã phát hành các mô hình được cho là có thể so sánh với các mô hình hàng đầu của Mỹ nhưng giá rẻ hơn nhiều, Huang cho biết họ đã "mở ra AI lý luận" và "mở ra một lĩnh vực hoàn toàn mới tiêu thụ lượng lớn" khả năng tính toán của Nvidia.
Thế hệ mới của các mô hình AI đã "khiến nhu cầu thực sự cao", với nhiều nhà phát triển AI sử dụng các loại mô hình mới.
Huang cũng đề cập đến cuộc gặp với Tổng thống Donald Trump vào cuối tháng 1, nhắc đến các biện pháp kiểm soát xuất khẩu chip bán dẫn hiện tại của Mỹ đối với Trung Quốc.
Ông khẳng định Nvidia "cam kết và rất nhiệt tình hợp tác với chính quyền Trump để đạt được mục tiêu và mong muốn chính quyền thành công," đồng thời lưu ý rằng công nghệ mà Nvidia đang xuất sang Trung Quốc đã kém xa 20 đến 60 lần so với công nghệ mới nhất của họ ở Mỹ.

📌 Jensen Huang dự đoán tương lai AI phát triển qua 3 giai đoạn: mô hình tiên tiến, AI tác nhân và AI vật lý. Với tăng trưởng mạnh mẽ của chi tiêu vốn cho trung tâm dữ liệu, ông dự báo nhiều năm xây dựng "nhà máy AI" phía trước, biến năng lượng thành trí tuệ số.

https://www.foxbusiness.com/technology/nvidia-ceo-jensen-huang-says-everyone-racing-adopt-ai-technology

Không có file đính kèm.

Nguồn tham khảo

126

AI market AI chips-hardware-compute 2025-02-27 14:38:29

DeepSeek: Mô hình AI giá rẻ đang đe dọa đế chế chip của Nvidia và kế hoạch đầu tư tỷ đô của Microsoft

Công ty AI Trung Quốc DeepSeek đã gây chấn động thị trường vào tháng 1/2025 khi phát hành mô hình DeepSeek-R1, tạm thời vượt qua ChatGPT của OpenAI để trở thành ứng dụng miễn phí được tải xuống nhiều nhất trên App Store của Apple.
Cổ phiếu Nvidia đã giảm hơn 15% trong một ngày giao dịch khi thị trường nhận ra rằng việc phát triển mô hình AI có thể được thực hiện với chi phí thấp hơn và ít tài nguyên hơn dự kiến. Tính từ đầu năm 2025, cổ phiếu Nvidia đã giảm gần 9%.
Theo CEO của Kolena Mohamed Elgendy, DeepSeek đã chứng minh có thể tối ưu hóa quy trình xây dựng mô hình để yêu cầu ít sức mạnh tính toán hơn, tác động tiêu cực đến Nvidia nhưng mở ra cơ hội cho nhiều công ty xây dựng các mô hình nền tảng.
DeepSeek sử dụng bộ xử lý Xeon và Gaudi của Intel, giúp khách hàng đạt hiệu suất tốt với chi phí thấp hơn.
Mặc dù có vấn đề về độ chính xác (tỷ lệ ảo giác 14,3% so với 2% của GPT-4 của OpenAI), DeepSeek vẫn được coi là bước đột phá trong cách tiếp cận hiệu quả để huấn luyện các mô hình lớn.
CEO của Vectara Amr Awadallah cho rằng con số 6 triệu USD mà DeepSeek tuyên bố để huấn luyện mô hình là không chính xác, và chi phí thực tế có thể lên đến 50 triệu USD - vẫn thấp hơn nhiều so với 149 triệu USD của Google Gemini.
Elgendy dự đoán sẽ có nhiều mô hình nền tảng được xây dựng với ngân sách tương đối thấp xuất hiện, đặc biệt trong các lĩnh vực cụ thể như y tế, nghiên cứu, dược phẩm, kế toán và tài chính.
Microsoft gần đây bị đồn thu hẹp kế hoạch xây dựng trung tâm dữ liệu AI, nhưng công ty đã phủ nhận và khẳng định cam kết chi 80 tỷ USD, mặc dù có thể "điều chỉnh chiến lược cơ sở hạ tầng ở một số lĩnh vực".
CEO của Nvidia Jensen Huang đã phản bác quan điểm cho rằng AI không cần tính toán nhiều hơn nữa, khẳng định rằng thực tế hoàn toàn ngược lại.
Awadallah dự đoán cạnh tranh sẽ gay gắt hơn giữa các nhà cung cấp cơ sở hạ tầng AI như Nvidia, và chỉ những công ty có thể duy trì hoạt động bất chấp sự sụt giảm biên lợi nhuận mới có thể tồn tại và phát triển.

📌 DeepSeek-R1 của Trung Quốc đã chứng minh khả năng tạo ra mô hình AI với chi phí thấp (khoảng 6-50 triệu USD so với 149 triệu USD của Google), làm lung lay thị trường chip AI và buộc Nvidia cùng các gã khổng lồ công nghệ phải đối mặt với thách thức dân chủ hóa công nghệ AI.

https://www.cnbc.com/2025/02/26/how-the-first-nvidia-earnings-day-after-deepseek-will-be-different.html

Không có file đính kèm.

Nguồn tham khảo

118

AI chips-hardware-compute 2025-02-27 14:18:25

Nvidia CEO Jensen Huang: Các mô hình lý luận như DeepSeek R1 cần nhiều tài nguyên tính toán hơn gấp 100 lần

Jensen Huang, giám đốc điều hành Nvidia, tuyên bố các mô hình lý luận AI cần nhiều tài nguyên tính toán gấp 100 lần so với các mô hình truyền thống.
Mặc dù Nvidia vượt qua kỳ vọng về doanh thu, các nhà đầu tư vẫn phản ứng dè dặt sau khi DeepSeek ra mắt các mô hình nguồn mở hiệu quả cao vào tháng trước.
Huang gọi DeepSeek là "một đổi mới xuất sắc" và nhấn mạnh rằng hầu hết mọi nhà phát triển AI đang áp dụng R1 hoặc các kỹ thuật tương tự để nâng cao hiệu suất mô hình.
Trong một cuộc phỏng vấn tuần trước, Huang cho rằng các nhà đầu tư đã hiểu sai hiện tượng DeepSeek và tác động của nó đối với Nvidia.
Các nhà cung cấp dịch vụ đám mây đã xác nhận với Business Insider rằng nhu cầu về chip mạnh mẽ nhất của Nvidia sẽ tiếp tục tăng.
Theo nhà phân tích Dan Morgan của Synovus, tác động lâu dài của DeepSeek là thúc đẩy xu hướng hướng tới "các mô hình lý luận tiêu tốn nhiều tài nguyên".
Jensen Huang tiết lộ rằng "phần lớn" nhu cầu tính toán của Nvidia hiện nay đến từ suy luận (inference) - loại hình tính toán AI tinh chỉnh mô hình và tạo ra phản hồi lý luận.
Dòng chip Blackwell mới nhất của Nvidia được thiết kế để nâng cao khả năng suy luận lên một tầm cao mới.
Cạnh tranh trong lĩnh vực chip AI đang gia tăng. Các công ty khởi nghiệp như Tenstorrent đã huy động được gần 700 triệu USD và Etched đã nhận được 120 triệu USD vốn đầu tư mới vào năm ngoái.
Các nhà phân tích bắt đầu lo ngại về vị thế thống trị của Nvidia trước sự cạnh tranh từ các chip AI tùy chỉnh của các công ty đám mây như Google và Amazon.
Lucas Keh, nhà phân tích của Third Bridge, cho biết: "Chúng tôi nghe nói rằng thị phần của họ trong lĩnh vực suy luận có thể giảm xuống 50% khi thị trường phát triển."

📌 Nvidia vẫn dẫn đầu thị trường chip AI nhưng đối mặt với áp lực cạnh tranh gia tăng, đặc biệt trong lĩnh vực suy luận (inference). Các mô hình lý luận mới như DeepSeek R1 đòi hỏi tài nguyên tính toán lớn hơn 100 lần, nhưng các đối thủ đang nhắm vào thị trường tiềm năng này với các giải pháp hiệu quả hơn.

https://www.businessinsider.com/nvidia-ceo-jensen-huang-says-reasoning-models-require-more-compute-2025-2

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-02-26 01:08:31

Bất chấp lệnh cấm của Mỹ, Huawei tăng gấp đôi hiệu suất sản xuất chip AI

Huawei đã cải thiện đáng kể tỷ lệ thành phẩm (yield) trong sản xuất chip AI tiên tiến, tăng từ 20% lên gần 40% trong vòng một năm, đánh dấu một bước đột phá quan trọng cho tham vọng công nghệ bán dẫn của Trung Quốc.
Sự cải thiện này giúp dây chuyền sản xuất chip Ascend của Huawei lần đầu tiên có lãi, và công ty đang hướng tới mục tiêu nâng tỷ lệ thành phẩm lên 60%, tương đương với tiêu chuẩn ngành cho các chip tương tự.
Thành tựu này là một bước tiến quan trọng cho hy vọng của Trung Quốc trong việc xây dựng cơ sở hạ tầng điện toán hỗ trợ ngành AI đang phát triển mạnh, bất chấp các biện pháp kiểm soát xuất khẩu của Mỹ.
Huawei đã triển khai bộ xử lý Ascend 910C mới nhất, mang lại hiệu suất tốt hơn so với sản phẩm 910B trước đó, và đã hợp tác với SMIC - tập đoàn sản xuất bán dẫn Trung Quốc đang bị trừng phạt - để tái khởi động chip Ascend.
Chính phủ Trung Quốc đang hỗ trợ nỗ lực này, khuyến khích các công ty công nghệ trong nước mua nhiều chip AI của Huawei hơn và giảm dần sự phụ thuộc vào Nvidia - công ty trị giá 3,3 nghìn tỷ USD của Mỹ.
Huawei dự kiến sản xuất 100.000 bộ xử lý 910C và 300.000 chip 910B trong năm nay, so với 200.000 chip 910B và không có sản xuất hàng loạt 910C trong năm 2024.
Dù vậy, Nvidia vẫn được dự đoán sẽ bán nhiều chip AI hơn Huawei tại Trung Quốc, mặc dù công ty Mỹ chỉ có thể bán chip H20 cho khách hàng Trung Quốc - phiên bản ít mạnh hơn của chip H100 được thiết kế để tuân thủ các quy định kiểm soát xuất khẩu của Washington.
Huawei đang nỗ lực cải thiện các vấn đề kỹ thuật trong sản phẩm Ascend 910B trước đây, vốn không hoạt động tốt cho việc đào tạo mô hình quy mô lớn do các vấn đề về kết nối liên chip và vấn đề bộ nhớ.
Hiện tại, Huawei chiếm hơn ba phần tư tổng sản lượng chip AI ở Trung Quốc, trong khi các đối thủ nhỏ hơn gặp khó khăn trong việc cạnh tranh để có đủ công suất tại các nút sản xuất hàng đầu của SMIC.
Huawei đã nổi lên như là ứng cử viên hàng đầu thách thức Nvidia trong thị trường chip "suy luận" (inference), phần cứng được sử dụng để chạy các mô hình AI sau khi chúng đã được đào tạo.

📌 Bất chấp lệnh cấm công nghệ của Mỹ, Huawei đã tăng gấp đôi tỷ lệ thành phẩm chip AI lên 40%, giúp dây chuyền sản xuất có lãi lần đầu tiên. Với mục tiêu sản xuất 400.000 chip năm nay, Huawei đang dần thu hẹp khoảng cách với Nvidia, thúc đẩy tham vọng độc lập công nghệ bán dẫn của Trung Quốc.

https://www.ft.com/content/f46b7f6d-62ed-4b64-8ad7-2417e5ab34f6

#FT

Huawei cải thiện sản xuất chip AI, tạo bước đột phá cho mục tiêu công nghệ của Trung Quốc

Công ty Trung Quốc nâng cao “tỷ lệ thành phẩm” của dòng bán dẫn mới nhất, bất chấp nỗ lực của Mỹ nhằm cản trở tiến bộ sản xuất

Huawei đã tăng gấp đôi tỷ lệ thành phẩm của chip AI mới nhất lên gần 40% và đặt mục tiêu cải thiện lên 60%.

Huawei đã cải thiện đáng kể số lượng chip trí tuệ nhân tạo tiên tiến có thể sản xuất, đánh dấu một bước đột phá quan trọng giúp Trung Quốc đẩy mạnh phát triển ngành bán dẫn tiên tiến của riêng mình.

Tập đoàn Trung Quốc này đã nâng “tỷ lệ thành phẩm” – phần trăm số chip hoạt động được trên dây chuyền sản xuất – của dòng chip AI mới nhất lên gần 40%, theo 2 nguồn tin có hiểu biết về vấn đề này. Đây là mức tăng gấp đôi so với khoảng 20% vào một năm trước.

Đây là một bước tiến quan trọng đối với Huawei, công ty đang tung ra bộ vi xử lý Ascend 910C mới nhất, có hiệu năng tốt hơn so với dòng 910B trước đó.

Tỷ lệ thành phẩm được cải thiện đồng nghĩa với việc dây chuyền sản xuất chip Ascend của Huawei lần đầu tiên có lãi, theo các nguồn tin am hiểu về hoạt động kinh doanh của công ty. Huawei đặt mục tiêu nâng tỷ lệ này lên 60%, phù hợp với tiêu chuẩn ngành đối với các chip tương tự.

Bước đột phá này là một tiến bộ đáng kể đối với tham vọng của Trung Quốc trong việc xây dựng hạ tầng tính toán phục vụ ngành AI đang phát triển mạnh, bất chấp các biện pháp kiểm soát xuất khẩu của Mỹ nhằm cản trở năng lực phát triển công nghệ nhạy cảm của nước này.

Nỗ lực này nhận được sự hỗ trợ từ nhà nước, với việc Bắc Kinh kêu gọi các công ty công nghệ trong nước mua nhiều chip AI của Huawei hơn và giảm sự phụ thuộc vào Nvidia – tập đoàn chip Mỹ trị giá 3,3 nghìn tỷ USD, vốn vẫn là nhà cung cấp chiếm thị phần lớn nhất tại Trung Quốc.

Nhà sáng lập Huawei, Nhậm Chính Phi, đã nói với Chủ tịch Trung Quốc Tập Cận Bình vào tuần trước rằng những lo ngại về việc Trung Quốc “thiếu hồn và cốt” đã giảm bớt. Ông nhấn mạnh: “Tôi tin chắc một Trung Quốc vĩ đại hơn sẽ trỗi dậy nhanh hơn”, theo tờ Nhân Dân Nhật Báo.

Cụm từ “thiếu hồn và cốt” bắt nguồn từ một tuyên bố vào năm 1999 của một cựu bộ trưởng công nghệ Trung Quốc về ngành công nghiệp thông tin của nước này, trong đó “cốt” ám chỉ chất bán dẫn và “hồn” đề cập đến hệ điều hành.

Tiến bộ của Huawei có ý nghĩa lớn với tham vọng tự chủ chip của Trung Quốc

Những bước tiến gần đây của Huawei cũng đóng vai trò quan trọng trong mục tiêu của Trung Quốc về việc đạt được sự tự chủ hoàn toàn trong sản xuất chip tiên tiến.

Nhà sản xuất chip hàng đầu thế giới, Taiwan Semiconductor Manufacturing Company (TSMC), đã buộc phải dừng sản xuất chip Ascend và chip smartphone cao cấp cho Huawei vào năm 2020, sau khi Washington chặn Huawei tiếp cận công nghệ sản xuất có liên quan đến Mỹ.

Austin Lyons, nhà phân tích chất bán dẫn tại công ty tư vấn Creative Strategies, so sánh cột mốc sản xuất của Huawei với tỷ lệ thành phẩm ước tính 60% của TSMC đối với bộ xử lý AI Nvidia H100 – một con chip có kích thước tương đương. Theo ông, trên cơ sở đó, một sản phẩm đối thủ như chip của Huawei vẫn có thể khả thi về mặt thương mại ngay cả khi tỷ lệ thành phẩm chỉ đạt 40%.

Huawei đã hợp tác với công ty gia công bán dẫn Semiconductor Manufacturing International Corp (SMIC), vốn đang bị trừng phạt, để tái khởi động sản xuất chip Ascend.

Hiện tại, SMIC sử dụng quy trình gọi là N+2, có khả năng sản xuất chip tiên tiến mà không cần công nghệ in thạch bản cực tím (EUV). Trung Quốc hiện bị cấm mua máy in thạch bản EUV – loại thiết bị sản xuất chip tiên tiến nhất từ tập đoàn Hà Lan ASML.

Huawei, có trụ sở tại Thâm Quyến, dự kiến sản xuất 100.000 bộ xử lý 910C và 300.000 chip 910B trong năm nay, theo các nguồn tin có hiểu biết về kế hoạch của công ty. Con số này so với 200.000 chip 910B và không có sản xuất hàng loạt 910C vào năm 2024.

Những số liệu này cho thấy Nvidia vẫn sẽ bán được nhiều chip AI hơn Huawei tại Trung Quốc, dù hãng chip Mỹ chỉ có thể bán dòng H20 – một phiên bản yếu hơn của H100 – cho khách hàng Trung Quốc nhằm tuân thủ quy định kiểm soát xuất khẩu của Washington.

Công ty tư vấn SemiAnalysis ước tính Nvidia đã thu về 12 tỷ USD từ việc bán 1 triệu chip H20 cho Trung Quốc vào năm ngoái.

Huawei tìm cách chiếm thị phần AI từ Nvidia tại Trung Quốc

Huawei vẫn đối mặt với nhiều thách thức trong việc thuyết phục khách hàng từ bỏ Nvidia. Một nguồn tin nội bộ cho biết phần mềm Cuda của Nvidia dễ sử dụng hơn và có khả năng xử lý dữ liệu nhanh hơn so với các sản phẩm của Huawei.

Các công ty AI và nhà nghiên cứu của Huawei cũng cho biết chip Ascend 910B không hoạt động hiệu quả trong việc đào tạo mô hình AI quy mô lớn, do gặp vấn đề về kết nối giữa các chip và dung lượng bộ nhớ.

Huawei đang cố gắng khắc phục những hạn chế này bằng cách hợp tác với các đối tác để sửa lỗi phần mềm và tăng dung lượng bộ nhớ trong dòng 910C mới nhất.

Tuy nhiên, Huawei vẫn đang nổi lên như đối thủ hàng đầu của Nvidia trong thị trường chip “suy luận” – loại phần cứng dùng để vận hành các mô hình AI sau khi đã được đào tạo.

Một số khách hàng tiềm năng của dòng chip Ascend cũng gặp khó khăn trong việc đảm bảo nguồn cung, do Huawei ưu tiên các đơn hàng từ các nhà cung cấp dịch vụ đám mây quốc doanh lớn như China Mobile.

Hiện tại, Huawei chiếm hơn 75% tổng sản lượng chip AI tại Trung Quốc, theo một nguồn tin am hiểu về hoạt động kinh doanh của công ty. Các đối thủ nhỏ hơn gặp khó khăn trong việc cạnh tranh với Huawei để giành đủ năng lực sản xuất tại các quy trình tiên tiến của SMIC, nguồn tin này cho biết.

Huawei improves production of AI chips in breakthrough for China’s tech goals
Chinese company improves ‘yield’ of latest semiconductor, despite US efforts to prevent manufacturing advances
Montage of Huawei founder Ren Zhengfei, Huawei logo and Ascend 910C chip
Huawei has doubled the yield of its latest AI chips to close to 40%, and aims to further improve this to 60% © FT montage/Bloomberg

Roula Khalaf, Editor of the FT, selects her favourite stories in this weekly newsletter.
Huawei has significantly improved the amount of advanced artificial intelligence chips it can produce, in a key breakthrough that supports China’s push to create its own advanced semiconductors.
The Chinese conglomerate has increased the “yield” — the percentage of functional chips made on its production line — of its latest AI chips to close to 40 per cent, according to two people with knowledge of the matter. That represents a doubling from 20 per cent about a year ago.
The move represents an important advance for Huawei, which has been rolling out its latest Ascend 910C processors, which offer better performance than its previous 910B product.
The improved yield means that Huawei’s production line for Ascend chips has become profitable for the first time, according to the people with knowledge of its business. The company has a goal to further improve yields to 60 per cent, in line with the industry standard for similar chips.
The breakthrough is a step forward for China’s hopes to build computing infrastructure that can support its burgeoning AI industry, despite US export controls designed to hamper the country’s ability to develop sensitive technologies.
The effort has state support, with Beijing urging local tech companies to buy more of Huawei’s AI chips and shift away from $3.3tn US chipmaker Nvidia, which remains the market leader in China by far.
Huawei founder Ren Zhengfei told Chinese President Xi Jinping last week that the worries China had about a “lack of core and soul” had eased, adding “I firmly believe a greater China will rise faster”, the People’s Daily reported.
The phrase “lack of core and soul” dates back to a 1999 comment by a former China technology minister about the country’s information industry, with “core” referring to semiconductors and “soul” referring to operating systems.
Huawei’s recent progress is also significant to achieving China’s goal of reaching full independence for advanced chip production.
The world’s leading chip manufacturer, Taiwan Semiconductor Manufacturing Company, was forced to stop making Ascend chips and advanced smartphone chips in 2020, after Washington blocked Huawei from accessing manufacturing that used US technology.
Austin Lyons, semiconductor analyst with consultancy Creative Strategies, compared Huawei’s production milestone to TSMC’s estimated 60 per cent yield for production of Nvidia’s H100 AI processor, a similarly sized chip. On that basis, it is possible that a rival product such as Huawei’s would be commercially viable at a 40 per cent yield, he said.
Huawei partnered with the sanctioned Chinese fabrication group Semiconductor Manufacturing International Corp to relaunch its Ascend chip.

SMIC currently uses its so-called N+2 process, which is capable of producing advanced chips without extreme ultraviolet technology. China is currently banned from purchasing EUV lithography machines, the most cutting-edge chipmaking equipment from Dutch group ASML.
Shenzhen-based Huawei plans to produce 100,000 910C processors and 300,000 910B chips this year, said people with knowledge of its plans. This compares with 200,000 910B and no mass production of 910C in 2024.
The figures suggest that Nvidia will still sell more AI chips in China than Huawei, despite the US company only being able to sell Chinese customers its H20 chips, a less powerful version of its H100 chips designed to adhere to Washington export controls.
The consultancy SemiAnalysis has estimated that Nvidia made $12bn selling 1mn of its H20 chips to China last year.
Recommended
News in-depthSemiconductors
Huawei seeks to grab market share in AI chips from Nvidia in China
Montage of the Nvidia Blackwell GPU chip, Huawei’s Ascend AI processor and the logos of both companies
Huawei faces challenges to convince more customers to abandon Nvidia. One person close to the business pointed to Nvidia’s Cuda software, which is known for being easier to use and capable of faster data processing than Huawei’s offerings.
AI companies and Huawei researchers have also said that the Ascend 910B did not work well for large-scale model training, because of problems with inter-chip connectivity and memory issues.
Huawei has been trying to improve these issues by working with partners to resolve software bugs and increase memory capacity in its latest 910C series.
However, Huawei has still emerged as the frontrunner to challenge Nvidia in the market for so-called “inference” chips, the hardware used to run AI models once they have been trained.
Prospective customers for the Ascend chip have also cited difficulties securing supplies, with Huawei prioritising orders for large state-run cloud providers like China Mobile.

Huawei currently accounts for more than three-quarters of the overall output of AI chips in China, said one of the people with knowledge of its business. The smaller rivals have struggled to compete with Huawei to get enough capacity at SMIC’s leading nodes, the person added.

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-02-26 00:25:19

Sự bùng nổ của DeepSeek thúc đẩy đơn đặt hàng chip H20 của Nvidia tại Trung Quốc

Các công ty Trung Quốc đang tăng cường đặt hàng chip AI H20 của Nvidia do nhu cầu bùng nổ đối với các mô hình AI chi phí thấp từ DeepSeek, theo thông tin từ sáu nguồn tin thân cận.
Tencent Holdings, Alibaba Group Holding và ByteDance đã "tăng đáng kể" đơn đặt hàng chip H20 - loại chip dành riêng cho thị trường Trung Quốc do các biện pháp kiểm soát xuất khẩu của Mỹ - kể từ khi startup AI Trung Quốc này trở nên nổi tiếng toàn cầu vào tháng trước.
Ngoài nhu cầu nội bộ về chip AI tiên tiến, 3 gã khổng lồ công nghệ này còn cung cấp dịch vụ điện toán đám mây cho phép các công ty khác tiếp cận và sử dụng công cụ AI.
Các công ty nhỏ hơn trong lĩnh vực y tế và giáo dục cũng đang mua các máy chủ AI được trang bị mô hình DeepSeek và chip Nvidia H20, theo một nguồn tin từ một trong những nhà sản xuất máy chủ lớn nhất Trung Quốc.
Trước đây, chỉ các công ty tài chính và viễn thông có nguồn vốn dồi dào mới mua máy chủ với hệ thống tính toán AI.
Sự gia tăng đơn đặt hàng này, được Reuters đưa tin lần đầu tiên, nhấn mạnh vị thế thống trị thị trường của Nvidia và có thể giúp giảm bớt lo ngại rằng DeepSeek có thể gây ra sự sụt giảm nhu cầu chip AI.
Chính quyền Tổng thống Donald Trump của Mỹ đang xem xét áp đặt các hạn chế đối với việc bán chip H20 cho Trung Quốc, theo Reuters đưa tin.
Mặc dù nguy cơ kiểm soát thêm có thể là một yếu tố trong việc tăng đơn đặt hàng, nhưng các nguồn tin đều chỉ ra DeepSeek là nguyên nhân chính.
DeepSeek đã tạo ra chấn động toàn cầu kể từ khi ra mắt các mô hình mới nhất của mình, thu hút sự chú ý rộng rãi trong cộng đồng AI quốc tế.
Sự phát triển này diễn ra trong bối cảnh cạnh tranh ngày càng tăng trong lĩnh vực AI giữa Mỹ và Trung Quốc, với các biện pháp kiểm soát xuất khẩu đang định hình lại chuỗi cung ứng toàn cầu cho công nghệ quan trọng này.

📌 DeepSeek đang thúc đẩy làn sóng đặt hàng mới cho chip H20 của Nvidia tại Trung Quốc, với Tencent, Alibaba và ByteDance dẫn đầu đà tăng. Hiện tượng này không chỉ khẳng định vị thế của Nvidia mà còn mở rộng thị trường AI sang các lĩnh vực như y tế và giáo dục.

https://www.scmp.com/tech/big-tech/article/3299980/deepseeks-ai-models-drive-surging-orders-nvidia-h20-chips-china-sources-say

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-02-24 10:54:45

5 dự báo về thị trường hạ tầng AI

📈 5 dự báo về thị trường hạ tầng AI:

Chi tiêu hạ tầng AI sẽ vượt 200 tỷ USD vào 2028
Theo IDC, chi tiêu cho hạ tầng AI đang tăng trưởng mạnh, đạt 47,4 tỷ USD trong nửa đầu 2024, tăng 97% so với năm trước. Máy chủ chiếm 95% tổng chi tiêu, trong đó các máy chủ có AI accelerators tăng 178%. IDC dự báo đến 2028, hơn 75% chi tiêu máy chủ AI sẽ dành cho các hệ thống này. Mỹ dẫn đầu thị trường, chiếm gần 60% tổng chi tiêu.
Chi tiêu trung tâm dữ liệu AI sẽ vượt 1.000 tỷ USD vào 2029
Dell’Oro Group dự đoán chi tiêu cho trung tâm dữ liệu AI sẽ tiếp tục tăng bất chấp những nỗ lực bền vững. Các khoản đầu tư vào GPU, AI accelerator, tối ưu mô hình AI và hạ tầng mạng thế hệ mới sẽ là yếu tố thúc đẩy. Chương trình Stargate Project trị giá 500 tỷ USD của chính phủ cũng góp phần tạo động lực.
Thị trường hạ tầng AI sẽ đạt 360,59 tỷ USD vào 2032
Fortune Business Insights ước tính thị trường hạ tầng AI tăng trưởng 29% CAGR từ 2023 đến 2032. Phần cứng vẫn là phân khúc có doanh thu lớn nhất. Máy học (ML) đang thống trị, nhưng deep learning sẽ phát triển nhanh trong các lĩnh vực như y tế, ô tô và tài chính. Bắc Mỹ và châu Á - Thái Bình Dương sẽ dẫn đầu về đầu tư.
Tăng trưởng AI nhờ 5G và nhu cầu tính toán cao
Grand View Research báo cáo rằng thị trường hạ tầng AI đạt 35,62 tỷ USD năm 2023 và sẽ tăng trưởng hơn 30% CAGR đến 2030. AI cần khả năng tính toán mạnh để xử lý dữ liệu lớn, cùng với xu hướng chuyển dịch sang nền tảng đám mây. Sự phát triển của 5G giúp tăng tốc truyền dữ liệu, hỗ trợ tốt hơn cho AI inference và điện toán biên.
Hạ tầng AI đạt gần 500 tỷ USD vào 2034
Precedence Research dự đoán thị trường sẽ đạt khoảng 60 tỷ USD trong năm 2025, với tốc độ tăng trưởng 26,6% CAGR trong thập kỷ tới, đạt gần 500 tỷ USD vào 2034. Bắc Mỹ tăng trưởng nhanh hơn mức trung bình toàn cầu (26,75%) và đạt 19,36 tỷ USD năm 2024. Các doanh nghiệp ngày càng đầu tư mạnh vào AI để cải thiện hiệu suất, sáng tạo và lợi thế cạnh tranh.

📌
Thị trường hạ tầng AI sẽ bùng nổ với tốc độ tăng trưởng hai chữ số trong thập kỷ tới. IDC dự báo chi tiêu vượt 200 tỷ USD vào 2028, trong khi Dell’Oro Group dự đoán trung tâm dữ liệu AI sẽ chạm mốc 1.000 tỷ USD vào 2029. Fortune Business Insights đặt mục tiêu 360 tỷ USD vào 2032, còn Precedence Research ước tính gần 500 tỷ USD vào 2034. Bắc Mỹ và châu Á dẫn đầu xu hướng, với động lực từ AI accelerators, 5G, đám mây và tối ưu mô hình AI. 🚀

https://www.rcrwireless.com/20250220/fundamentals/ai-infrastructure-market

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute AI chính phủ 2025-02-23 11:07:20

Khái niệm Hạ tầng AI công cộng, vai trò và khả năng xây dựng trong tương lai

Hội nghị thượng đỉnh AI Action diễn ra tại Paris từ 10-11/2/2025, đưa khái niệm "AI công cộng" trở thành chủ đề nóng
AI công cộng là hệ sinh thái AI do chính phủ xây dựng và sở hữu, phục vụ mục tiêu xã hội thay vì lợi nhuận
Các thành phần chính của AI công cộng bao gồm:
Trung tâm dữ liệu cho tổ chức công và nghiên cứu
Bộ dữ liệu công khai chất lượng cao
Mô hình nền tảng nguồn mở với giá trị dân chủ
Tiêu chuẩn và cơ chế quản trị
Lợi ích của AI công cộng:
Đảm bảo tiếp cận AI chất lượng cao với chi phí thấp
Thúc đẩy nghiên cứu khoa học và giải quyết vấn đề xã hội
Tạo ra các dịch vụ AI thúc đẩy giá trị dân chủ
Cân bằng quyền lực với các công ty công nghệ lớn
EU đầu tư 56 triệu USD vào mô hình nguồn mở châu Âu, thấp hơn nhiều so với:
Mistral huy động được 560 triệu USD
Chi phí ước tính 30-35 tỷ EUR cho "CERN cho AI" trong 3 năm đầu
Dự án Stargate của Mỹ với hàng chục tỷ USD
Các dự án AI công cộng hiện có:
OpenEuroLLM phát triển mô hình cho ngôn ngữ châu Âu
Euro Stack xây dựng hệ sinh thái số hoàn chỉnh
Các dự án quốc gia tại Thụy Điển, Thụy Sĩ, Singapore và Mỹ

📌 AI công cộng là giải pháp cần thiết để cân bằng quyền lực với các công ty công nghệ, tuy nhiên mức đầu tư 56 triệu USD của EU vẫn quá thấp so với nhu cầu thực tế là 30-35 tỷ EUR. Cần nhiều nỗ lực hơn từ chính phủ các nước để xây dựng hạ tầng AI phục vụ lợi ích công.

https://www.weforum.org/stories/2025/02/public-ai-infrastructure-a-media-leader-explains/

Hạ tầng AI công cộng: Nó là gì, chúng ta có cần không và liệu nó có bao giờ được xây dựng?

🗓 Ngày 11/02/2025
📝 Một lãnh đạo trong ngành truyền thông giải thích

🔥 "Public AI" (AI công cộng) là một trong những chủ đề nóng tại AI Action Summit ở Paris, diễn ra từ ngày 10-11/02/2025.

🚀 Public AI là gì?
Đây là ý tưởng rằng chính phủ nên xây dựng và kiểm soát hạ tầng AI công cộng, thay vì để AI chỉ phục vụ mục tiêu lợi nhuận của các tập đoàn tư nhân.

Nhưng cụ thể thì điều đó trông như thế nào?

📌 Bài viết này lần đầu tiên được xuất bản trên Futurepolis vào ngày 07/02/2025 với tiêu đề: "Vậy, nó kiểu như một cây cầu, nhưng dành cho AI?"

AI công cộng: Một hệ sinh thái AI song song?

AI Action Summit tại Paris năm nay là sự kiện AI toàn cầu lớn nhất kể từ hội nghị thượng đỉnh năm 2023 ở Anh.

🌍 Một trong những thuật ngữ gây chú ý nhất tại hội nghị là "Public AI", một khái niệm vẫn còn xa lạ với nhiều người.

📢 Giải thích ngắn gọn:
Hãy tưởng tượng một hệ sinh thái AI song song, được xây dựng và sở hữu bởi chính phủ (hoặc các tổ chức phi lợi nhuận). Vì không bị chi phối bởi lợi nhuận, nó có thể mang lại:
✅ AI phục vụ nghiên cứu khoa học và giải quyết các vấn đề xã hội thay vì tập trung vào quảng cáo hay tối ưu hóa doanh thu.
✅ AI hỗ trợ các ngôn ngữ và khu vực bị bỏ qua bởi các công ty công nghệ lớn.
✅ AI không phát tán thông tin sai lệch hoặc kích động thù địch.
✅ AI có giá cả hợp lý, đảm bảo mọi người đều có thể tiếp cận.

📌 Một ý tưởng đầy hứa hẹn, nhưng ai sẽ trả tiền để xây dựng nó?

Vấn đề của AI tư nhân

🔍 Nhìn lại lịch sử phát triển hạ tầng:
1️⃣ Giai đoạn đầu: Một hoặc một số công ty tiên phong xây dựng hệ thống mới (đường sắt, điện, viễn thông).
2️⃣ Vấn đề xuất hiện: Hệ thống có thể không phổ cập, đắt đỏ hoặc không đồng nhất (ví dụ: đường sắt với khổ đường khác nhau).
3️⃣ Chính phủ can thiệp:

Quốc hữu hóa (ví dụ: điện tại Anh).
Tạo ưu đãi để mở rộng quy mô (ví dụ: điện tại Mỹ).
Chia nhỏ độc quyền (ví dụ: Standard Oil).
Áp đặt quy định (ví dụ: ngành đường sắt).

🚀 Nhưng trong thời đại kỹ thuật số, mọi thứ diễn ra nhanh hơn.

Mạng xã hội, điện toán đám mây và AI đã trở thành hạ tầng ngay khi ra mắt, khiến chính phủ không kịp phản ứng.
Truy cập vào AI gần như miễn phí, nhưng đổi lại người dùng bị khai thác dữ liệu cá nhân.
Không có tiêu chuẩn chung, mỗi công ty AI vận hành theo quy tắc riêng của mình.
Nguy cơ AI gây hại rất khó xác định, không giống như nước bị ô nhiễm hay cầu sập.

🛑 Điều này có lợi cho các công ty công nghệ lớn, nhưng có thể gây hại cho xã hội.

Những giải pháp khả thi

📜 1. Quy định pháp lý (Regulation)

Các chính phủ có thể đặt ra quy định chặt chẽ hơn cho AI, giống như họ làm với ngành cấp nước hoặc giao thông.
Nhưng AI có thể xuất hiện dưới nhiều dạng khác nhau, nên rất khó để quản lý toàn diện.

🔓 2. Mô hình AI mã nguồn mở (Open-source AI)

Các mô hình như Meta Llama, Mistral, hay AI mã nguồn mở khác cho phép bất kỳ ai tạo AI riêng.
Tuy nhiên, điều này không đảm bảo AI được sử dụng vì lợi ích chung—AI mã nguồn mở vẫn có thể bị lạm dụng như AI độc quyền.

🗳 3. Quản trị AI dân chủ (Democratic AI Governance)

Đề xuất này khuyến khích các công ty AI lắng nghe ý kiến của công chúng về AI "tốt" là gì.
Nhưng nó phụ thuộc vào thiện chí của các công ty AI, và không có cơ chế ép buộc họ phải thực hiện.

👉 Chính vì vậy, AI công cộng (Public AI) đang được đề xuất như một giải pháp thay thế.

Public AI: Một hướng đi mới?

💡 Nếu các chính phủ hoặc tổ chức phi lợi nhuận xây dựng hạ tầng AI công cộng, chúng ta có thể:
✅ Giảm phụ thuộc vào các công ty công nghệ lớn.
✅ Tạo ra AI vì lợi ích chung, thay vì chỉ phục vụ doanh thu.
✅ Đảm bảo tiêu chuẩn đạo đức, tránh các vấn đề như phân biệt đối xử trong AI.

📌 Nhưng vấn đề lớn nhất vẫn là: Ai sẽ đầu tư xây dựng nó?

🔥 Public AI có thể trở thành một "cầu nối" giữa công nghệ và lợi ích xã hội—nếu có đủ sự ủng hộ và tài trợ.

AI công cộng sẽ bao gồm những gì?

Ý tưởng về AI công cộng (Public AI) là các chính phủ xây dựng một hệ sinh thái AI do nhà nước sở hữu và vận hành, gồm các thành phần chính:

🔹 Trung tâm dữ liệu (datacenters):

Cung cấp tài nguyên tính toán cho cơ quan chính phủ, tổ chức nghiên cứu và doanh nghiệp nhỏ để huấn luyện và chạy mô hình AI.

🔹 Tập dữ liệu huấn luyện mở:

Một thư viện dữ liệu AI giống như “Thư viện Alexandria”, không chứa dữ liệu rác, không vi phạm bản quyền và có thể được điều chỉnh theo bối cảnh văn hóa hoặc lĩnh vực cụ thể (ví dụ: mô hình hóa khí hậu).

🔹 Mô hình nền tảng mã nguồn mở thực sự:

Được các quốc gia, viện nghiên cứu và công ty sử dụng, phát triển dựa trên dữ liệu đáng tin cậy và các giá trị dân chủ.

🔹 Các tiêu chuẩn, mục tiêu và cơ chế quản lý AI:

Định hướng sự phát triển của AI theo hướng có lợi cho xã hội, thay vì chỉ phục vụ lợi nhuận.

Lợi ích của AI công cộng là gì?

Vấn đề của AI công cộng là nó không giống các dự án hạ tầng truyền thống. Thay vì bù đắp khoảng trống mà khu vực tư nhân bỏ qua, nó lại xây dựng một hệ thống song song với AI thương mại. Giống như việc xây dựng một hệ thống đường sắt hoàn toàn mới bên cạnh hệ thống hiện có, thay vì chỉ hỗ trợ mở rộng các tuyến nhánh.

Không có một phép so sánh lịch sử nào hoàn toàn phù hợp, nhưng có một số ẩn dụ giúp giải thích những khía cạnh khác nhau của AI công cộng:

📺 BBC hoặc PBS của AI:

AI tư nhân có thể tạo ra thông tin sai lệch, định hướng dư luận hoặc tối ưu hóa lợi nhuận bằng cách khai thác dữ liệu người dùng.
AI công cộng sẽ giống như BBC hay PBS, đảm bảo AI phục vụ lợi ích chung, thúc đẩy các giá trị dân chủ và cung cấp thông tin đáng tin cậy.

🔬 CERN hoặc DARPA của AI:

Nhiều đột phá công nghệ quan trọng của thế kỷ 20 đến từ các phòng thí nghiệm tư nhân như AT&T, Xerox và IBM.
Nhưng DARPA (Mỹ) và CERN (châu Âu) đã tài trợ nghiên cứu khoa học mà các công ty tư nhân không có động lực theo đuổi, như phát triển AI cho y tế công cộng, nghiên cứu khí hậu hoặc cải cách tư pháp.
AI công cộng có thể hoạt động theo cách tương tự, cung cấp công cụ cho các nhà khoa học và nhà nghiên cứu để giải quyết các vấn đề lớn của nhân loại.

📬 Bưu điện của AI:

Nếu DHL hay FedEx ngừng phục vụ một số khu vực hoặc tăng giá, bưu điện nhà nước sẽ đảm bảo mọi người vẫn có thể tiếp cận dịch vụ gửi thư với giá cả phải chăng.
AI công cộng sẽ đảm bảo rằng tất cả mọi người đều có quyền truy cập vào AI chất lượng cao, miễn phí hoặc với chi phí hợp lý—thay vì phải phụ thuộc vào các công ty tư nhân có thể thay đổi chính sách bất cứ lúc nào (ví dụ: Twitter dưới quyền Elon Musk).

⚡ Dịch vụ công ích của AI:

Công ty tư nhân có một mục tiêu: tối đa hóa lợi nhuận.
Công ty điện lực công cộng không chỉ cung cấp điện mà còn duy trì lưới điện, cấp nước cho nông nghiệp, tài trợ hệ thống xử lý nước thải.
AI công cộng có thể hoạt động theo cách tương tự, đảm bảo AI không chỉ an toàn mà còn phục vụ các giá trị xã hội.

📚 Thư viện công cộng của AI:

Giống như thư viện công cộng giúp mọi người tiếp cận tri thức miễn phí, AI công cộng giúp mọi người tiếp cận AI mà không bị ràng buộc bởi doanh thu hoặc quảng cáo.

Ẩn dụ về siêu thị: AI công cộng như một chuỗi siêu thị lành mạnh

🛒 Hãy tưởng tượng thế này:

Các siêu thị tư nhân bán thực phẩm chế biến sẵn, nhiều đường và không bền vững.
Một số khu vực nông thôn hoặc nghèo khó không có siêu thị hoặc chỉ có một chuỗi độc quyền với giá cắt cổ.
Giờ hãy tưởng tượng chính phủ mở một chuỗi siêu thị công cộng, chỉ bán thực phẩm hữu cơ, ít đường, không chế biến quá mức, với giá gốc, có mặt ở khắp nơi, và cung cấp lớp học nấu ăn và dinh dưỡng miễn phí.

📌 Tác động của siêu thị công cộng này?
✅ Tạo động lực để ngành thực phẩm tư nhân cải thiện tiêu chuẩn.
✅ Cải thiện sức khỏe cộng đồng, giảm chi phí y tế, tăng năng suất lao động.
✅ Giảm tác động môi trường từ ngành thực phẩm công nghiệp.

⚡ Trong phép ẩn dụ này:

Nguồn gốc thực phẩm sạch = dữ liệu huấn luyện AI công cộng, không vi phạm bản quyền.
Thực phẩm lành mạnh = mô hình AI công cộng, phục vụ lợi ích xã hội.
Siêu thị công cộng = trung tâm dữ liệu và hạ tầng AI do chính phủ quản lý.
Siêu thị tư nhân = các công ty AI thương mại.

💡 Nếu đặt vấn đề theo cách này, có vẻ điên rồ khi một chính phủ xây dựng hệ thống siêu thị công cộng. Nhưng thực tế, có thể họ nên làm vậy. Và có lẽ AI công cộng cũng vậy.

Vấn đề của AI công cộng: Ai sẽ tài trợ và xây dựng?

🚀 AI công cộng có thể trở thành một trong những sáng kiến công nghệ quan trọng nhất thế kỷ 21. Nhưng để làm được điều đó, cần:
💰 Tài trợ chính phủ hoặc liên minh quốc tế (giống như CERN hoặc NASA).
📜 Quy định rõ ràng về quyền truy cập dữ liệu và tiêu chuẩn AI.
🛠 Cơ sở hạ tầng tính toán mạnh mẽ, đủ sức cạnh tranh với các công ty tư nhân.

🔥 Vậy, AI công cộng có thể trở thành hiện thực? Hay nó chỉ là một ý tưởng không tưởng?

🔎 Dù câu trả lời là gì, một điều rõ ràng: nếu AI trở thành "điện" hay "internet" của thế kỷ 21, chúng ta không thể để nó chỉ nằm trong tay một số ít công ty tư nhân.

Hạ tầng AI công cộng: Nó có thực sự cần thiết và liệu có bao giờ được xây dựng?

📌 AI công cộng (Public AI) là chủ đề nóng tại AI Action Summit ở Paris, diễn ra từ ngày 10-11/02/2025.
📌 AI công cộng là gì? Đó là ý tưởng rằng chính phủ nên xây dựng và kiểm soát hạ tầng AI công cộng, thay vì để AI chỉ phục vụ lợi nhuận của các tập đoàn tư nhân.

💡 Nhưng AI công cộng sẽ trông như thế nào? Và quan trọng hơn, liệu nó có bao giờ được thực hiện?

📢 Bài viết này lần đầu tiên được xuất bản trên Futurepolis vào ngày 07/02/2025 với tiêu đề: "Vậy, nó kiểu như một cây cầu, nhưng dành cho AI?"

AI công cộng sẽ bao gồm những gì?

Ý tưởng về AI công cộng là các chính phủ xây dựng một hệ sinh thái AI song song do nhà nước sở hữu và vận hành, gồm các thành phần chính:

🔹 Trung tâm dữ liệu (datacenters)

Cung cấp tài nguyên tính toán cho cơ quan chính phủ, tổ chức nghiên cứu và doanh nghiệp nhỏ để huấn luyện và chạy mô hình AI.

🔹 Tập dữ liệu huấn luyện mở

Một thư viện dữ liệu AI giống như “Thư viện Alexandria”, không chứa dữ liệu rác, không vi phạm bản quyền và có thể được điều chỉnh theo bối cảnh văn hóa hoặc lĩnh vực cụ thể (ví dụ: mô hình hóa khí hậu).

🔹 Mô hình nền tảng mã nguồn mở thực sự

Được các quốc gia, viện nghiên cứu và công ty sử dụng, phát triển dựa trên dữ liệu đáng tin cậy và các giá trị dân chủ.

🔹 Các tiêu chuẩn, mục tiêu và cơ chế quản lý AI

Định hướng sự phát triển của AI theo hướng có lợi cho xã hội, thay vì chỉ phục vụ lợi nhuận.

Vấn đề của AI tư nhân

Quốc hữu hóa (ví dụ: điện tại Anh).
Tạo ưu đãi để mở rộng quy mô (ví dụ: điện tại Mỹ).
Chia nhỏ độc quyền (ví dụ: Standard Oil).
Áp đặt quy định (ví dụ: ngành đường sắt).

🚀 Nhưng trong thời đại kỹ thuật số, mọi thứ diễn ra nhanh hơn.

Mạng xã hội, điện toán đám mây và AI đã trở thành hạ tầng ngay khi ra mắt, khiến chính phủ không kịp phản ứng.
Truy cập vào AI gần như miễn phí, nhưng đổi lại người dùng bị khai thác dữ liệu cá nhân.
Không có tiêu chuẩn chung, mỗi công ty AI vận hành theo quy tắc riêng của mình.
Nguy cơ AI gây hại rất khó xác định, không giống như nước bị ô nhiễm hay cầu sập.

🛑 Điều này có lợi cho các công ty công nghệ lớn, nhưng có thể gây hại cho xã hội.

Các giải pháp hiện tại không đủ mạnh

📜 1. Quy định pháp lý (Regulation)

Các chính phủ có thể đặt ra quy định chặt chẽ hơn cho AI, giống như họ làm với ngành cấp nước hoặc giao thông.
Nhưng AI có thể xuất hiện dưới nhiều dạng khác nhau, nên rất khó để quản lý toàn diện.

🔓 2. Mô hình AI mã nguồn mở (Open-source AI)

Các mô hình như Meta Llama, Mistral, hay AI mã nguồn mở khác cho phép bất kỳ ai tạo AI riêng.
Tuy nhiên, điều này không đảm bảo AI được sử dụng vì lợi ích chung—AI mã nguồn mở vẫn có thể bị lạm dụng như AI độc quyền.

🗳 3. Quản trị AI dân chủ (Democratic AI Governance)

Đề xuất này khuyến khích các công ty AI lắng nghe ý kiến của công chúng về AI "tốt" là gì.
Nhưng nó phụ thuộc vào thiện chí của các công ty AI, và không có cơ chế ép buộc họ phải thực hiện.

👉 Chính vì vậy, AI công cộng (Public AI) đang được đề xuất như một giải pháp thay thế.

Liệu AI công cộng có bao giờ được xây dựng?

🔍 Hiện nay, một số dự án AI công cộng đang được triển khai trên thế giới:
✅ OpenEuroLLM: Mô hình ngôn ngữ mở dành cho các ngôn ngữ châu Âu.
✅ Euro Stack: Hệ sinh thái số hoàn chỉnh dành cho châu Âu.
✅ Các dự án AI quốc gia tại Thụy Điển, Thụy Sĩ, Singapore, Mỹ, nhưng tương lai của chúng vẫn chưa rõ ràng.
✅ Paris Summit 2025: Một tổ chức AI công cộng mới có thể sẽ được công bố.

💰 Nhưng ngân sách dành cho AI công cộng vẫn còn rất nhỏ so với AI tư nhân:

EU tài trợ 56 triệu USD cho một mô hình AI mở (có thể là OpenEuroLLM).
Trung Quốc huấn luyện mô hình DeepSeek R1 với chi phí chỉ 6 triệu USD, nhưng con số thực tế có thể cao hơn nhiều.
Mistral, startup AI lớn nhất châu Âu, đã huy động hơn 10 lần con số đó chỉ trong một vòng gọi vốn năm ngoái.
Một nghiên cứu ước tính rằng cần tới 30-35 tỷ EUR để xây dựng một "CERN cho AI" trong ba năm đầu tiên.

🚀 Mỹ có thể chi hàng trăm tỷ USD vào dự án AI "Stargate", nhưng con số này vẫn chưa được xác nhận chính thức.

📌 Tại AI Action Summit ở Paris, mạng lưới AI công cộng đang đề xuất các sáng kiến lớn:
✅ Mô hình LLM mã nguồn mở.
✅ Thư viện dữ liệu AI công cộng (“Thư viện Alexandria”).
✅ Cơ sở hạ tầng tính toán khổng lồ ("CERN cho AI").
✅ Khung pháp lý và tiêu chuẩn AI công cộng.

🎯 Liệu họ có thành công? Hay AI công cộng sẽ mãi là một ý tưởng trên giấy?

Tóm lại: AI công cộng có thể là chìa khóa cho tương lai

🔮 AI công cộng có thể đảm bảo:
✅ AI phục vụ lợi ích chung, thay vì chỉ chạy theo lợi nhuận.
✅ Tiếp cận AI công bằng, không phụ thuộc vào quyết định của một số tập đoàn công nghệ lớn.
✅ Bảo vệ dữ liệu cá nhân, tránh bị khai thác cho quảng cáo hoặc lợi ích kinh doanh.
✅ Thúc đẩy nghiên cứu khoa học và giải quyết các vấn đề xã hội.

📢 Tuy nhiên, để AI công cộng trở thành hiện thực, cần có sự ủng hộ của các chính phủ, liên minh quốc tế và nguồn vốn khổng lồ.

🔥 Câu hỏi đặt ra là: Liệu thế giới có sẵn sàng đầu tư vào AI công cộng như cách họ đã làm với đường sắt, điện và internet?

Không có file đính kèm.

Nguồn tham khảo

218

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-02-23 10:45:01

Trung tâm dữ liệu AI tại Anh có thể trở thành dự án tốn kém vô ích

Chính phủ Anh đang thúc đẩy kế hoạch phát triển "Khu vực phát triển AI", tập trung vào các vùng công nghiệp cũ có sẵn cơ sở hạ tầng
Các địa điểm tiềm năng cần đáp ứng yêu cầu về nguồn điện lớn (trên 500 MW) hoặc khả năng tăng công suất điện
Khu vực đầu tiên được công bố tại Culham, Oxfordshire - nơi đặt Cơ quan Năng lượng Nguyên tử Anh, với dân số chỉ 453 người
Dự án này gây lo ngại về:
Tốc độ cấp phép nhanh có thể bỏ qua ý kiến người dân địa phương
Số lượng việc làm thấp (chỉ 30-50 vị trí thường trực cho mỗi trung tâm)
Tiêu thụ điện năng lớn (tham khảo Ireland: trung tâm dữ liệu chiếm 21% điện năng quốc gia năm 2023)
Các chuyên gia cảnh báo:
AI không đảm bảo mang lại hiệu quả như kỳ vọng trong dịch vụ công
Các giải pháp AI hiệu quả thường dựa trên mô hình cổ điển, không phải LLM
Xung đột tiềm ẩn giữa người dân và trung tâm dữ liệu về vấn đề năng lượng
Quy trình triển khai:
Mở đăng ký chính thức vào mùa xuân
Công bố đợt đầu tiên vào mùa hè
Ưu tiên các khu vực Scotland, Wales và phía Bắc nước Anh

📌 Chính phủ Anh đang đẩy mạnh phát triển trung tâm dữ liệu AI dù đối mặt nhiều rủi ro: tiêu thụ điện cao (tham khảo Ireland 21%), tạo ít việc làm (30-50 vị trí/trung tâm), và có thể trở thành dự án đầu tư công nghệ tốn kém không hiệu quả.

https://www.theregister.com/2025/02/12/uk_gov_ai_datacenters/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-02-23 10:33:09

Tại sao chi tiêu cho AI không chậm lại

- Các công ty công nghệ lớn, chính phủ và nhà đầu tư mạo hiểm đang đổ tiền vào AI ở mức chưa từng có

- Xu hướng chuyển dịch từ mô hình ngôn ngữ lớn sang mô hình lập luận (reasoning models) đang diễn ra mạnh mẽ

- Mô hình lập luận tiêu thụ tài nguyên gấp 100 lần so với mô hình ngôn ngữ lớn thông thường do quá trình "suy luận chuỗi" kéo dài

- OpenAI, DeepSeek và xAI đã ra mắt các mô hình lập luận: o1, R1 và Grok 3

- Google, Microsoft và Meta dự kiến chi 215 tỷ USD cho đầu tư cơ bản (chủ yếu cho trung tâm dữ liệu AI) trong năm 2025, tăng 45% so với năm trước

- DeepSeek R1 đã chứng minh khả năng giảm chi phí đào tạo AI, nhưng nhu cầu tăng từ mô hình lập luận vẫn khiến tổng nhu cầu tài nguyên tăng gấp 10 lần

- Các công ty đang chuyển hướng từ đào tạo mô hình sang sử dụng mô hình (inference)

- Công ty Baseten cho biết khách hàng của họ tiêu thụ nhiều tài nguyên AI hơn dù đã cắt giảm chi phí 60%

- Dự đoán trong 2 năm tới, chip AI chuyên dụng có thể giúp hệ thống hiệu quả hơn 1.000 lần

- Nhà đầu tư kỳ vọng nhu cầu AI có thể tăng gấp nghìn tỷ lần trong thập kỷ tới

📌 Nhu cầu tài nguyên điện toán cho AI dự kiến tăng mạnh do sự phát triển của mô hình lập luận tiêu tốn gấp 100 lần tài nguyên. Ba gã khổng lồ công nghệ dự chi 215 tỷ USD cho cơ sở hạ tầng AI năm 2025, phản ánh kỳ vọng thị trường AI tăng gấp 1.000 lần trong tương lai gần.

https://www.wsj.com/tech/ai/ai-chatgpt-chips-infrastructure-openai-81cf4d40

#WSJ

Tại sao chi tiêu cho AI không chậm lại

Nhu cầu ngày càng tăng đối với các mô hình suy luận sẽ tiếp tục tiêu thụ điện năng, vi mạch và diện tích trung tâm dữ liệu trong tương lai gần

Tác giả: Christopher Mims
Ngày 21/02/2025 – 8:00 PM ET

Bất chấp một giai đoạn ngắn nhà đầu tư nghi ngờ, tiền đang đổ vào trí tuệ nhân tạo (AI) từ các công ty công nghệ lớn, chính phủ và các quỹ đầu tư mạo hiểm ở mức chưa từng có. Để hiểu tại sao, cần nhìn vào cách AI đang thay đổi.

Công nghệ này đang chuyển từ mô hình ngôn ngữ lớn (LLM) truyền thống sang mô hình suy luận và AI agent. Huấn luyện mô hình ngôn ngữ lớn—loại mà bạn thường thấy trong các chatbot AI miễn phí—đòi hỏi một lượng lớn điện năng và thời gian tính toán. Tuy nhiên, chúng ta đang nhanh chóng tìm ra cách để giảm lượng tài nguyên cần thiết khi vận hành chúng. Trong khi đó, mô hình suy luận, vốn được xây dựng dựa trên LLM, lại khác biệt ở chỗ việc vận hành chúng tiêu tốn nhiều tài nguyên hơn nhiều, cả về vi mạch lẫn điện năng.

Kể từ khi OpenAI giới thiệu mô hình suy luận đầu tiên của mình, o1, vào tháng 9, các công ty AI đã gấp rút tung ra các hệ thống cạnh tranh. Trong số đó có DeepSeek’s R1, mô hình gây chấn động giới công nghệ cũng như làm thay đổi định giá của nhiều công ty công nghệ và năng lượng vào đầu năm nay, cùng với Grok 3 của xAI (công ty của Elon Musk) vừa được ra mắt.

DeepSeek đã gây ra một "cơn hoảng loạn" vì nó cho thấy có thể huấn luyện một mô hình AI với chi phí thấp hơn nhiều so với các mô hình khác, điều này có thể làm giảm nhu cầu đối với trung tâm dữ liệu và các vi mạch tiên tiến đắt đỏ. Nhưng điều DeepSeek thực sự làm được là đẩy ngành AI tiến xa hơn về phía các mô hình suy luận tiêu tốn nhiều tài nguyên, có nghĩa là cơ sở hạ tầng điện toán vẫn cực kỳ cần thiết.

Với những khả năng vượt trội của mình, các hệ thống suy luận có thể sớm trở thành tiêu chuẩn cho nhiều tác vụ AI. CEO OpenAI, Sam Altman, cho biết bản nâng cấp lớn tiếp theo của mô hình AI của công ty ông sẽ bao gồm khả năng suy luận nâng cao.

Tại sao mô hình suy luận cần nhiều năng lượng hơn?

Mô hình suy luận có thể tiêu thụ gấp 100 lần tài nguyên tính toán so với mô hình ngôn ngữ lớn truyền thống, theo bài đăng gần đây của Kari Briski, Phó chủ tịch quản lý sản phẩm AI tại Nvidia.

🔍 Lý do:

Các mô hình này dành nhiều phút hoặc thậm chí hàng giờ để tự "trò chuyện" với chính mình theo chuỗi suy luận phức tạp.
Người dùng có thể không nhìn thấy toàn bộ quá trình này, nhưng nó tiêu tốn một lượng lớn vi mạch và điện năng.
Số lượng tài nguyên mà AI sử dụng tỷ lệ thuận với số từ được tạo ra. Nếu một mô hình suy luận tạo ra gấp 100 lần số từ để trả lời một câu hỏi, nó sẽ tiêu thụ lượng điện năng và tài nguyên tương ứng.

Việc các mô hình suy luận truy cập internet càng làm tăng mức tiêu thụ tài nguyên. Các mô hình "deep research" của Google, OpenAI và Perplexity đều hoạt động theo cách này.

Chi tiêu cho AI vẫn tiếp tục tăng mạnh

Nhu cầu về sức mạnh tính toán chỉ mới bắt đầu tăng. Để đáp ứng điều đó, Google, Microsoft và Meta đang lên kế hoạch chi ít nhất 215 tỷ USD vào chi tiêu vốn trong năm 2025, chủ yếu dành cho trung tâm dữ liệu AI. Đây sẽ là mức tăng 45% so với năm ngoái.

📈 Dự báo nhu cầu AI trong tương lai có thể tính toán theo một công thức đơn giản:

1️⃣ Giá trị đầu tiên trong phương trình này là tài nguyên tính toán cần thiết để xử lý một token thông tin trong một hệ thống AI như ChatGPT.

2️⃣ Vào tháng 1, có vẻ như chi phí xử lý mỗi token (cả về sức mạnh tính toán và chi phí đô la) sẽ giảm mạnh sau khi DeepSeek R1 ra mắt.

3️⃣ DeepSeek chứng minh rằng có thể huấn luyện và triển khai AI hiệu quả hơn nhiều so với cách tiếp cận trước đây của các phòng thí nghiệm AI Mỹ. Điều này có vẻ như sẽ giảm đáng kể nhu cầu tính toán cho AI, có thể chỉ còn 1/10 hoặc ít hơn so với hiện tại.

4️⃣ Nhưng nếu các mô hình suy luận trở thành tiêu chuẩn và tăng mức tiêu thụ tài nguyên lên 100 lần, thì tổng nhu cầu điện toán sẽ vẫn tăng gấp 10 lần so với hiện nay.

📌 Kết luận: Ngay cả khi công nghệ giúp giảm chi phí tính toán cho mỗi mô hình AI, tổng nhu cầu tài nguyên vẫn tăng lên theo cấp số nhân do sự phổ biến của mô hình suy luận.

Sự dịch chuyển từ huấn luyện AI sang vận hành AI

Các doanh nghiệp đang ngày càng phát hiện ra rằng các mô hình AI mới mạnh mẽ hơn rất nhiều, khiến họ sử dụng AI thường xuyên hơn. Điều này làm dịch chuyển nhu cầu tính toán từ huấn luyện mô hình sang vận hành mô hình (hay còn gọi là "inference" trong ngành AI).

💡 Khác biệt giữa huấn luyện và vận hành AI:

Huấn luyện (Training): Dạy mô hình AI cách hiểu và xử lý dữ liệu (tốn nhiều tài nguyên nhưng chỉ diễn ra một lần).
Vận hành (Inference): Mô hình trả lời câu hỏi, thực hiện tác vụ mỗi khi người dùng gọi (diễn ra liên tục và có thể tiêu tốn nhiều tài nguyên hơn).

📌 Điểm mấu chốt: Khi AI được ứng dụng nhiều hơn trong công việc hằng ngày, chi phí vận hành sẽ chiếm phần lớn chi tiêu cho AI, thay vì chỉ tập trung vào huấn luyện mô hình như trước đây.

Chi tiêu cho AI không chậm lại – và nhu cầu đang tăng vọt

Mô hình suy luận đang thúc đẩy nhu cầu khổng lồ về tài nguyên tính toán AI

Tuhin Srivastava, CEO của Baseten—công ty cung cấp tài nguyên điện toán AI cho các doanh nghiệp khác—cho biết rằng sự chuyển dịch sang vận hành AI (inference) đã diễn ra mạnh mẽ.

Khách hàng của Baseten chủ yếu là các công ty công nghệ sử dụng AI trong ứng dụng và dịch vụ của họ, bao gồm:

Descript – Công cụ giúp người sáng tạo nội dung chỉnh sửa âm thanh và video trực tiếp từ bản ghi chép.
PicnicHealth – Startup chuyên xử lý hồ sơ y tế.

🔍 Nhận định của Srivastava:
💡 Khách hàng của Baseten ngày càng cần nhiều tài nguyên AI hơn khi nhu cầu đối với sản phẩm của họ tăng nhanh chóng.
📈 Ví dụ: "Chúng tôi đã giúp một khách hàng giảm chi phí xuống 60% chỉ trong 6 tháng. Nhưng chỉ 3 tháng sau, mức tiêu thụ tài nguyên AI của họ đã cao hơn cả lúc ban đầu."

Các phòng thí nghiệm AI lớn vẫn tiếp tục cuộc đua

Các phòng thí nghiệm AI hàng đầu như OpenAI, Google và Meta vẫn đang chạy đua để phát triển những mô hình AI ngày càng mạnh mẽ hơn.

🎯 Mục tiêu: Chiếm lĩnh thị trường AI—một thị trường vẫn còn non trẻ nhưng có tiềm năng khổng lồ.
💰 Bất chấp chi phí, những công ty này sẵn sàng đầu tư hàng chục tỷ USD vào AI để dẫn đầu cuộc chơi.

📢 Chris Taylor, CEO của Fractional AI (một startup tại San Francisco giúp các công ty phần mềm tích hợp AI tùy chỉnh) nhận định:
"Tôi nghĩ rằng các phòng thí nghiệm AI tiên phong sẽ phải tiếp tục rót một lượng tiền khổng lồ để đẩy ranh giới công nghệ tiến xa hơn."

🚀 Các công ty như Baseten, Fractional AI và nhiều công ty khác trong hệ sinh thái AI đều phụ thuộc vào những mô hình AI tiên tiến nhất để cung cấp dịch vụ cho khách hàng của họ.

AI có thể trở nên hiệu quả hơn 1.000 lần trong vài năm tới

🔮 Dự báo từ Tomasz Tunguz, nhà đầu tư mạo hiểm và sáng lập Theory Ventures:
💡 Trong vòng vài năm tới, vi mạch chuyên biệt cho AI sẽ giúp hệ thống AI hiệu quả hơn gấp 1.000 lần so với hiện tại.
💰 Nhà đầu tư và các công ty công nghệ lớn đang đặt cược rằng:

Trong vòng 10 năm tới, nhu cầu đối với AI có thể tăng gấp 1.000 tỷ lần nhờ vào mô hình suy luận và tốc độ ứng dụng AI nhanh chóng.

📌 Tầm nhìn về tương lai của AI:
"Mỗi lần bạn nhấn một phím trên bàn phím, hoặc phát âm một từ vào micro, ít nhất một AI sẽ xử lý hoặc thao túng dữ liệu đó," Tunguz nói.
👉 Nếu điều đó trở thành hiện thực, thị trường AI có thể lớn hơn gấp 1.000 lần so với hiện nay.

🔥 AI không chỉ đang phát triển—nó đang bùng nổ với tốc độ chưa từng có.

Why AI Spending Isn’t Slowing Down
Soaring demand for reasoning models will consume electricity, microchips and data-center real estate for the foreseeable future
Christopher Mims
By
Christopher Mims
Feb. 21, 2025 8:00 pm ET

Despite a brief period of investor doubt, money is pouring into artificial intelligence from big tech companies, national governments and venture capitalists at unprecedented levels. To understand why, it helps to appreciate the way that AI itself is changing.
The technology is shifting away from conventional large language models and toward reasoning models and AI agents. Training conventional large language models—the kind you’ve encountered in free versions of most AI chatbots—requires vast amounts of power and computing time. But we’re rapidly figuring out ways to reduce the amount of resources they need to run when a human calls on them. Reasoning models, which are based on large language models, are different in that their actual operation consumes many times more resources, in terms of both microchips and electricity.
Since OpenAI previewed its first reasoning model, called o1, in September, AI companies have been rushing to release systems that can compete. This includes DeepSeek’s R1, which rocked the AI world and the valuations of many tech and power companies at the beginning of this year, and Elon Musk’s xAI, which just debuted its Grok 3 reasoning model.
DeepSeek caused a panic of sorts because it showed that an AI model could be trained for a fraction of the cost of other models, something that could cut demand for data centers and expensive advanced chips. But what DeepSeek really did was push the AI industry even harder toward resource-intensive reasoning models, meaning that computing infrastructure is still very much needed.
Owing to their enhanced capabilities, these reasoning systems will likely soon become the default way that people use AI for many tasks. OpenAI Chief Executive Sam Altman said the next major upgrade to his company’s AI model will include advanced reasoning capabilities.
Why do reasoning models—and the products they’re a part of, like “deep research” tools and AI agents—need so much more power? The answer lies in how they work.
AI reasoning models can easily use more than 100 times as much computing resources as conventional large language models, Nvidia’s vice president of product management for AI, Kari Briski, wrote in a recent blog post. That multiplier comes from reasoning models spending minutes or even hours talking to themselves—not all of which the user sees—in a long “chain of thought.” The amount of computing resources used by a model is proportional to the number of words generated, so a reasoning model that generates 100 times as many words to answer a question will use that much more electricity and other resources.
Things can get even more resource-intensive when reasoning models access the internet, as Google’s, OpenAI’s and Perplexity’s “deep research” models do.
These demands for computing power are just the beginning. As a reflection of that, Google, Microsoft and Meta Platforms are collectively planning to spend at least $215 billion on capital expenditures—much of that for AI data centers—in 2025. That would represent a 45% increase in their capital spending from last year.
To demonstrate the projections of future AI demand, we can lay out a simple equation.
The first value in our equation is the amount of computing resources needed to process a single token of information in an AI like the one that powers ChatGPT.
In January, it appeared that the cost per token—in both computing power and dollars—would crash in the wake of the release of DeepSeek R1, the Chinese AI model. DeepSeek, with its accompanying paper, showed it was possible to both train and deliver AI in a way that was radically more efficient than the approaches previously disclosed by American AI labs.
On its face, this would seem to indicate that AI’s future demand for computing power would be some fraction of its current amount—say, a tenth, or even less. But the increase in demand from reasoning models when they are answering queries could more than make up for that. To look at in the most simplistic way, if new, more efficient AI models based on the insights that went into DeepSeek slash demand for computing power for AI by a tenth, but reasoning models become the standard and increase demand for those models by a factor of 100, that’s still a 10-fold increase in future demand for power for AI.
This is just the starting point. As businesses are discovering that the new AI models are more capable, they’re calling on them more and more often. This is shifting demand for computing capacity from training models toward using them—or what’s called “inference” in the AI industry.

Tuhin Srivastava, CEO of Baseten, which provides AI computing resources to other companies, says that this swing toward inference is already well under way. His customers consist of tech companies that use AI in their apps and services, such as Descript, which allows content creators to edit audio and video directly from a transcript of a recording, and PicnicHealth, a startup that processes medical records. Baseten’s customers are finding that they need more AI processing power as demand for their own products rapidly grows, says Srivastava.
“For one customer, we brought their costs down probably 60% six months ago, and within three months, they were already consuming at a higher level than they were consuming initially,” he adds.
All of the big AI labs at companies like OpenAI, Google and Meta are still trying to best one another by training ever-more-capable AI models. Whatever the cost, the prize is capturing as much of the still-nascent market for AIs as possible.
“I think it’s entirely possible that frontier labs need to keep pumping in staggering amounts of money in order to push the frontier forward,” says Chris Taylor, CEO of Fractional AI, a San Francisco-based startup that helps other software companies build and integrate custom AIs. His company, like Baseten and many others in the blossoming AI ecosystem, relies on those cutting-edge models to deliver results for its own customers.
Over the next couple of years, new innovations and more AI-specific microchips could mean systems that deliver AI to end customers become a thousand times more efficient than they are today, says Tomasz Tunguz, a venture capitalist and founder of Theory Ventures. The bet that investors and big tech companies are making, he adds, is that over the course of the coming decade, the amount of demand for AI models could go up by a factor of a trillion or more, thanks to reasoning models and rapid adoption.
“Every keystroke in your keyboard, or every phoneme you utter into a microphone, will be transcribed or manipulated by at least one AI,” says Tunguz. And if that’s the case, he adds, the AI market could soon be 1,000 times larger than it is today.
For more WSJ Technology analysis, reviews, advice and headlines, sign up for our weekly newsletter.
Write to Christopher Mims at [email protected]

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-02-23 02:02:44

Trung Quốc đẩy mạnh phát triển trung tâm dữ liệu AI thông qua hợp tác công-tư

Trung Quốc đang kết hợp nguồn lực từ khu vực tư nhân và nhà nước để thúc đẩy phát triển cơ sở hạ tầng điện toán AI
Đến giữa năm 2024, Trung Quốc đã hoàn thành hoặc đang xây dựng 250 trung tâm dữ liệu AI
Các công ty công nghệ như Merit Interactive, Infinigence AI và SiliconFlow đã ký thỏa thuận với chính quyền địa phương để phát triển công nghệ cho các trung tâm dữ liệu AI
Infinigence AI, được hậu thuẫn bởi HongShan và Qiming Venture Partners, cho thuê chip Nvidia cho các nhà phát triển ứng dụng AI
Chính phủ Thượng Hải đã công bố hợp tác với Infinigence AI và SiliconFlow để xây dựng nền tảng tạo ứng dụng AI tại trung tâm dữ liệu của China Telecom
Merit Interactive được chọn để hỗ trợ xây dựng trung tâm dữ liệu AI lớn tại thành phố Wenzhou
DeepSeek, startup Trung Quốc, gây chú ý khi phát hành mô hình AI có hiệu suất tương đương đối thủ Mỹ như OpenAI và Google
Huawei và SiliconFlow đã công bố hợp tác để cung cấp mô hình AI của DeepSeek thông qua dịch vụ đám mây của Huawei
Thị trường chip AI cao cấp H100 của Nvidia tại Trung Quốc đang phát triển mạnh dù Mỹ siết chặt kiểm soát xuất khẩu
Các nhà điều hành trung tâm dữ liệu nhà nước được ưu tiên tiếp cận chip AI Ascend của Huawei

📌 Trung Quốc đã xây dựng 250 trung tâm dữ liệu AI với sự kết hợp giữa đầu tư nhà nước và chuyên môn từ khu vực tư nhân. Các công ty như Infinigence AI, SiliconFlow đóng vai trò then chốt trong việc tối ưu hóa hiệu suất và giảm chi phí vận hành hệ thống.

https://www.ft.com/content/3d6601f0-c7cf-48a8-9ae2-e9820dedf0b0

#FT

Trung Quốc tận dụng nhân tài công nghệ để thúc đẩy bùng nổ trung tâm dữ liệu AI
Bắc Kinh đang huy động nguồn lực từ khu vực tư nhân và nhà nước để đẩy nhanh việc áp dụng công nghệ phát triển nhanh

Các trung tâm dữ liệu thuộc sở hữu nhà nước của Trung Quốc, với lượng lớn chip trí tuệ nhân tạo, đang tận dụng chuyên môn của các nhóm công nghệ để củng cố khoản đầu tư hàng tỷ USD của họ, trong nỗ lực trên toàn quốc nhằm tăng cường áp dụng công nghệ phát triển nhanh này.

Chính quyền địa phương đã hợp tác với Merit Interactive cùng các start-up Infinigence AI và SiliconFlow để phát triển công nghệ phục vụ làn sóng trung tâm dữ liệu AI đang được xây dựng trên khắp Trung Quốc, theo những người có hiểu biết về vấn đề này và các tài liệu công khai.

Điều này cho thấy Trung Quốc ngày càng huy động nguồn lực từ cả khu vực tư nhân và nhà nước — kết hợp sức mạnh tài chính của chính quyền địa phương với nhân tài công nghệ từ các start-up — trong nỗ lực thúc đẩy mạng lưới hạ tầng điện toán AI.

“Mắc kẹt hiện tại không phải là có chip hay không, mà là tìm cách làm chúng hoạt động trong một cụm. Đây là công việc thực sự phức tạp,” một nhà đầu tư chip tại Bắc Kinh cho biết.

Động thái này diễn ra sau khi DeepSeek, một start-up Trung Quốc, thu hút sự chú ý toàn cầu vào tháng trước với một loạt các mô hình AI có hiệu năng tương đương với các đối thủ Mỹ như OpenAI và Google, nhưng được phát triển với ngân sách có vẻ hạn chế.

Công ty có trụ sở tại Chiết Giang này đã tận dụng kỹ thuật để khai thác tối đa sức mạnh tính toán từ các GPU của Nvidia, giúp giảm chi phí huấn luyện mô hình và suy luận — quá trình sử dụng mô hình ngôn ngữ lớn.

Các trung tâm dữ liệu nhà nước đang tận dụng nhân tài kỹ thuật từ khu vực tư nhân theo xu hướng bùng nổ hạ tầng AI trên khắp Trung Quốc, khi nước này đầu tư hàng tỷ USD để cạnh tranh với Mỹ nhằm dẫn đầu trong công nghệ phát triển nhanh này.

Tính đến giữa năm 2024, 250 trung tâm dữ liệu AI đã được hoàn thành hoặc đang trong quá trình xây dựng, theo dữ liệu chính thức. Chính quyền địa phương đóng vai trò trung tâm trong việc tài trợ các dự án hàng tỷ USD này, phát hành trái phiếu để tài trợ xây dựng và đảm bảo nguồn chip, theo những người quen thuộc với các thương vụ này. Tuy nhiên, họ cho biết nhiều dự án đang gặp khó khăn do thiếu chuyên môn kỹ thuật, dẫn đến lãng phí tài nguyên chip quan trọng.

Infinigence AI đã trở thành một trong những bên hưởng lợi chính từ nỗ lực của nhà nước nhằm cải thiện hiệu năng điện toán, ký kết các thỏa thuận với các trung tâm dữ liệu AI thuộc nhà nước tại Ninh Hạ và Thiên Tân.

Start-up có trụ sở tại Thượng Hải này, được hậu thuẫn bởi HongShan và Qiming Venture Partners, cho các nhà phát triển ứng dụng AI thuê chip Nvidia. Công ty kiếm lời từ chênh lệch giữa giá thuê phải trả cho nhà vận hành trung tâm dữ liệu và giá thu từ khách hàng cuối để truy cập chip.

Vào tháng 12, chính quyền Thượng Hải công bố hợp tác với Infinigence AI và start-up SiliconFlow để xây dựng một nền tảng cho phép khách hàng phát triển ứng dụng AI trên các mô hình bên thứ ba được lưu trữ tại một trung tâm dữ liệu do chi nhánh địa phương của nhà mạng viễn thông nhà nước China Telecom vận hành.

Cả hai công ty này phát triển công cụ suy luận giúp tăng tốc mô hình ngôn ngữ lớn (LLM) bằng các kỹ thuật điều chỉnh mô hình đã được huấn luyện trước với dữ liệu tốt hơn hoặc bằng cách nén kích thước mô hình AI.

Một nhà đầu tư cho biết các hợp tác như vậy rất quan trọng trong việc thu hút khách hàng AI. Các công ty công nghệ thường chạy thử nghiệm trước khi ký hợp đồng với trung tâm dữ liệu để đảm bảo không có gián đoạn trong các lần huấn luyện tốn kém.

Merit Interactive, một công ty tại Chiết Giang, cũng đã được lựa chọn nhờ chuyên môn kỹ thuật. Một hãng truyền thông địa phương tại Chiết Giang đã công bố một cuộc họp giữa các giám đốc điều hành Merit Interactive và quan chức địa phương, trong đó công ty được đánh giá cao về vai trò trong việc xây dựng một trung tâm dữ liệu AI lớn tại thành phố Ôn Châu.

Nhóm này có liên quan đến đối tác kinh doanh của nhà sáng lập DeepSeek, Liang Wenfeng, tại quỹ giao dịch định lượng High-Flyer, theo một người có hiểu biết về vấn đề này.

Theo các báo cáo truyền thông địa phương, Xu Jin, đồng sáng lập High-Flyer cùng Liang, từng làm giám đốc kỹ thuật tại Merit Interactive. Merit Interactive có hoạt động kinh doanh trải rộng từ nhập khẩu và xuất khẩu phần cứng công nghệ đến đầu tư vào các start-up công nghệ cao.

Mỹ cũng có một nhóm công ty “neocloud” tương tự, bao gồm CoreWeave, Lambda và Vultr, quản lý và cho thuê quyền truy cập vào các cụm điện toán trong trung tâm dữ liệu, cho phép các công ty sử dụng chip theo mô hình trả tiền theo nhu cầu.

Trung Quốc đã có thể phát triển ngành công nghiệp AI bất chấp Washington siết chặt kiểm soát xuất khẩu đối với các chip cao cấp của Nvidia. Một thị trường chợ đen sôi động đã hình thành cho các chip buôn lậu, với những người trong ngành lưu ý rằng giá của các chip H100 được săn đón đã giảm trong những tháng gần đây khi số lượng chip nhập lậu vào Trung Quốc gia tăng.

Các nhà vận hành trung tâm dữ liệu nhà nước cũng được ưu tiên tiếp cận chip AI Ascend của Huawei, đối thủ chính của Nvidia tại Trung Quốc trong thị trường suy luận đang phát triển.

Tương tự DeepSeek, cả Infinigence AI và SiliconFlow đều đang làm việc để giảm chi phí suy luận, giúp sử dụng LLM rẻ hơn. Họ cũng đang hợp tác với Huawei để giúp chip Ascend tương thích với các mô hình AI hàng đầu của Trung Quốc phục vụ cho suy luận.

Tháng này, Huawei và SiliconFlow công bố hợp tác để đưa các mô hình AI của DeepSeek lên dịch vụ đám mây của tập đoàn viễn thông này. Theo một người quen thuộc với vấn đề, DeepSeek đã hợp tác với hai công ty trên trong dịp Tết Nguyên đán để triển khai các mô hình trên chip Huawei.

China taps tech talent to boost AI data centre boom
Beijing is pooling resources from the private and state sectors to accelerate adoption of the fast-developing technology

Chinese state-owned data centres flush with artificial intelligence chips are tapping the expertise of technology groups to help bolster their multibillion-dollar investments as part of a nationwide effort to increase adoption of the fast-developing technology.
Local governments have enlisted Merit Interactive and start-ups Infinigence AI and SiliconFlow to develop technology for the surge of AI data centres being created across China, according to people with knowledge of the matter and public documents.
It shows how China is increasingly pooling resources from the private and state sectors — combining local government spending power with start-up tech talent — as part of a push to accelerate its network of AI computing infrastructure.
“The bottleneck at the moment isn’t getting the chips but figuring out how to make them work in a cluster. This is really complicated work,” said one Beijing-based chip investor.
The move comes after Chinese start-up DeepSeek captured the world’s attention last month with the latest in a series of AI model releases that showed similar performances to those of US rivals such as OpenAI and Google, but achieved on what appeared to be a bootstrapped budget.
The Zhejiang-based company used engineering prowess to squeeze as much computing power as possible from its Nvidia GPUs, driving down the cost of model training and so-called inference, the process of calling upon large language models.
State-owned data centres are leveraging this type of private sector engineering talent amid an AI infrastructure boom across China, as the country invests billions in the race against the US to take the lead in the rapidly developing technology.
By mid-2024, 250 AI data centres had been completed or were under construction, according to official data. Local governments have played a central role in bankrolling these multibillion-dollar projects, issuing bonds to finance construction and secure the chips, according to people familiar with the deals. However, they added that many of the projects had suffered from a lack of technical knowhow and had wasted critical chip resources.
Infinigence AI has emerged as one of the main beneficiaries of the state’s push to improve computing performance, signing deals with Ningxia and Tianjin state-run AI data centres.
The Shanghai-based start-up, backed by HongShan and Qiming Venture Partners, rents Nvidia chips to developers building AI applications. It makes money between the difference it pays the data centre operator and what it charges the end customer access to the chips.
In December, the Shanghai government announced a collaboration with Infinigence AI and start-up SiliconFlow to build a platform for customers to create AI applications on third-party models hosted at a data centre operated by a local offshoot of the state-owned China Telecom.
Both companies build inference engines that speed up LLMs through techniques that take pre-trained models and better adjust them to data or by compressing the size of AI models.
One investor said such collaborations were crucial to courting AI clients. Technology companies run tests before signing contracts with data centres to ensure no disruption during expensive training runs.
Zhejiang-based Merit Interactive has also been tapped for its engineering expertise. A Zhejiang media outlet publicised a meeting between Merit Interactive executives and local officials, where the company was singled out for its role in constructing a large AI data centre in the city of Wenzhou.
The group is associated with the business partner of DeepSeek founder Liang Wenfeng at his quant trading fund High-Flyer, according to a person with knowledge of the matter.
According to local media reports, Xu Jin, who co-founded High-Flyer with Liang, used to work at Merit Interactive as a technical director. Merit Interactive has business interests spanning an import and export business for tech hardware to investments in high-tech start-ups.
The US has a similar set of “neocloud” companies, including CoreWeave, Lambda and Vultr, which manage and rent out access to computing clusters in data centres, giving companies the ability to use the chips on a pay-as-you go basis.
China has been able to develop its AI industry despite Washington tightening its export controls on Nvidia’s high-end chips. A thriving black market has emerged for smuggled chips, with industry insiders noting that prices of highly sought-after H100s have decreased in recent months as the number of illicit chips brought into China has swelled.
State-owned data centre operators have also had preferential access to Huawei’s Ascend AI chips, the primary challenger to Nvidia in China for the growing inference market.
Like DeepSeek, both Infinigence AI and SiliconFlow have been working on driving down inference costs to make it cheaper to use LLMs. They are also working with Huawei to make the Ascend chips compatible with leading Chinese AI models for inference.
This month, Huawei and SiliconFlow announced a collaboration to make DeepSeek’s AI models available through the telecom giant’s cloud service. According to a person familiar with the matter, DeepSeek collaborated with the two companies during the Chinese new year holiday to deploy its models on Huawei chips.

Không có file đính kèm.

Nguồn tham khảo

136

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-02-22 07:21:41

Trung tâm dữ liệu mới 700 triệu USD của Elon Musk tại Atlanta, được trang bị 12.000 GPU

xAI của Elon Musk đang thiết lập trung tâm dữ liệu mới tại Atlanta, mở rộng thêm từ cơ sở hiện có ở Memphis
Tổng đầu tư thiết bị là 700 triệu USD, bao gồm:
442 triệu USD từ X
258 triệu USD từ xAI
Cấu hình phần cứng:
Tổng cộng 12.448 GPU Nvidia
Đa số là GPU H100 thế hệ Hopper (giá 277.000-500.000 USD/giá đỡ 8 chip)
3% là GPU A100 (giá 147.000 USD/giá đỡ 8 chip)
X đóng góp toàn bộ A100 và 11.000 H100
Thông số kỹ thuật:
Tiêu thụ điện ước tính 20 megawatt
Không yêu cầu làm mát bằng chất lỏng
Sử dụng thiết bị mạng Mellanox để tối ưu hiệu suất
Mục đích sử dụng:
Phát triển và huấn luyện các sản phẩm AI
Huấn luyện mô hình ngôn ngữ lớn
Phát triển tính năng tìm kiếm ngữ nghĩa cho nền tảng X
Nhân sự:
X có 16 nhân viên trong khu vực
xAI có 1 nhân viên tại cơ sở Georgia
2 nhân viên được liệt kê là "X Corp Partner"
Cam kết duy trì 24 việc làm
Ưu đãi thuế:
Tổng giá trị ước tính 10 triệu USD trong 10 năm
Chia theo tỷ lệ đầu tư phần cứng
Tác động kinh tế dự kiến trên 241 triệu USD

📌 Trung tâm dữ liệu Atlanta là minh chứng cho tham vọng AI của Elon Musk với 700 triệu USD đầu tư vào 12.448 GPU. Đây là bước đi chiến lược để cạnh tranh với các gã khổng lồ công nghệ như OpenAI và Google, đồng thời tận dụng sức mạnh phần cứng cho cả X và xAI.

https://www.businessinsider.com/xai-elon-musk-x-new-atlanta-data-center-2025-2

Không có file đính kèm.

Nguồn tham khảo

114

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-02-21 17:31:45

Trung tâm dữ liệu dưới biển của Trung Quốc xử lý 7.000 cuộc hội thoại DeepSeek mỗi giây

Trung Quốc vừa bổ sung một module trung tâm dữ liệu mới vào cụm xử lý dữ liệu dưới biển gần đảo Hải Nam vào ngày 19/02/2025
Công suất tính toán của cụm máy chủ ngầm tương đương với:
30.000 máy tính chơi game cao cấp hoạt động đồng thời
Hỗ trợ 7.000 cuộc hội thoại mỗi giây với chatbot AI DeepSeek của Trung Quốc
Có thể hoàn thành trong 1 giây các tác vụ mà máy tính thông thường mất 1 năm
Dự án được vận hành bởi công ty khởi nghiệp Shenzhen Hicloud Data Centre Technology
Ứng dụng chính của trung tâm dữ liệu:
Huấn luyện mô hình AI
Sản xuất game
Nghiên cứu khoa học biển
Ưu điểm của thiết kế dưới nước:
Sử dụng nước biển làm nguồn làm mát tự nhiên
Tiết kiệm đất đai
Giảm sử dụng nước ngọt
Tiết kiệm điện năng
Tăng hiệu quả tính toán
Các trung tâm dữ liệu truyền thống phải dùng điều hòa và hệ thống làm lạnh tốn nhiều điện để giải nhiệt cho máy chủ
Dự án này được triển khai trong bối cảnh cạnh tranh công nghệ Mỹ-Trung leo thang, đặc biệt sau khi DeepSeek thu hút sự chú ý toàn cầu với mô hình AI chi phí thấp

📌 Trung tâm dữ liệu dưới biển mới của Trung Quốc đạt công suất xử lý 7.000 cuộc hội thoại AI/giây, tương đương 30.000 máy tính cao cấp, sử dụng nước biển làm mát để tiết kiệm năng lượng, phục vụ phát triển AI và nghiên cứu biển.

https://www.scmp.com/news/china/science/article/3299313/chinas-subsea-data-centre-could-power-7000-deepseek-conversations-second-report

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute AI công nghiệp-lĩnh vực 2025-02-21 16:43:23

AI thiết kế chip không dây phức tạp trong vài giờ, vượt trội so với thiết kế của con người

Meta description: Nghiên cứu đột phá: AI thiết kế chip không dây phức tạp trong vài giờ, vượt trội so với thiết kế của con người nhưng có cấu trúc khó hiểu và ngẫu nhiên.

Meta keywords: AI thiết kế chip, chip không dây, mm-Wave, học sâu, thiết kế ngược, Princeton Engineering, 5G, hiệu suất chip

SEO title: Đột phá: AI thiết kế chip "kỳ lạ" vượt trội con người - Tương lai của ngành bán dẫn?

Tóm tắt chi tiết:

Các nhà nghiên cứu tại Đại học Princeton và Viện Công nghệ Ấn Độ đã chứng minh AI có thể thiết kế chip không dây phức tạp chỉ trong vài giờ, công việc thường mất nhiều tuần với con người
Nghiên cứu tập trung vào chip không dây mm-Wave, được sử dụng trong modem 5G trên điện thoại, vốn là thách thức lớn về độ phức tạp và thu nhỏ kích thước
AI sử dụng phương pháp thiết kế ngược thông qua học sâu: xác định đầu ra mong muốn và để thuật toán tự xác định các thông số đầu vào
Khác với cách tiếp cận truyền thống, AI xem xét chip như một thực thể đơn lẻ thay vì tập hợp các thành phần riêng lẻ
Cấu trúc chip do AI tạo ra có hình dạng ngẫu nhiên khó hiểu đối với con người, nhưng đạt hiệu suất vượt trội so với thiết kế hiện có
Giáo sư Kaushik Sengupta, tác giả chính, nhấn mạnh vẫn cần con người để khắc phục các lỗi, đặc biệt là hiện tượng "ảo giác" trong kết quả của AI
Phương pháp này mở ra khả năng phát triển nhanh các thiết kế lặp đi lặp lại, tối ưu hóa về:
Hiệu suất năng lượng
Hiệu suất tổng thể
Mở rộng dải tần số
Nghiên cứu được công bố trên tạp chí Nature Communications vào ngày 30/12/2024

📌 AI đã tạo ra bước đột phá trong thiết kế chip không dây mm-Wave với thời gian rút ngắn từ nhiều tuần xuống vài giờ. Mặc dù có cấu trúc ngẫu nhiên khó hiểu, chip do AI thiết kế đạt hiệu suất vượt trội, mở ra tương lai mới cho ngành công nghiệp bán dẫn.

Answer from Perplexity: pplx.ai/share

https://www.livescience.com/technology/computing/humans-cannot-really-understand-them-weird-ai-designed-chip-is-unlike-any-other-made-by-humans-and-performs-much-better

Không có file đính kèm.

Nguồn tham khảo

101

AI chips-hardware-compute 2025-02-20 16:26:02

GPU Trung Quốc vượt mặt Nvidia, tốc độ nhanh gấp 10 lần máy tính siêu cấp Mỹ

Các nhà nghiên cứu Trung Quốc đã phát triển thành công GPU nội địa với hiệu suất vượt trội, nhanh hơn gần 10 lần so với máy tính siêu cấp sử dụng GPU của Nvidia
Giáo sư Nan Tongchao từ Đại học Hohai ở Nam Kinh đã dẫn đầu nhóm nghiên cứu phát triển mô hình tính toán song song "đa nút, đa GPU"
Hệ thống chỉ cần 7 nút để đạt hiệu suất tương đương với hệ thống TRITON của Mỹ cần tới 64 nút, giảm 89% số nút sử dụng
Cấu hình phần cứng bao gồm:
CPU Hygon 7185 (32 nhân, 64 luồng) tốc độ 2,5 GHz
GPU nội địa với 128GB bộ nhớ
Băng thông mạng 200 Gb/giây
Thử nghiệm mô phỏng lũ lụt tại hồ chứa Zhuangli ở Sơn Đông:
Sử dụng 200 nút và 800 GPU
Hoàn thành trong 3 phút
Nhanh hơn 160 lần so với phương pháp truyền thống
Nghiên cứu được công bố trên Tạp chí Kỹ thuật Thủy lợi Trung Quốc ngày 3/1/2025, mã nguồn được công bố dưới dạng nguồn mở
Lệnh cấm vận của Mỹ ngăn Trung Quốc tiếp cận GPU A100 và H100 của Nvidia, cùng với phần mềm CUDA đã thúc đẩy Trung Quốc phát triển giải pháp riêng
Ứng dụng tiềm năng bao gồm thủy văn học, mô hình hóa phù sa và tương tác nước mặt

📌 GPU nội địa của Trung Quốc đã vượt qua GPU của Nvidia với hiệu suất cao hơn 10 lần, chỉ cần 7 nút thay vì 64 nút, và hoàn thành mô phỏng lũ lụt trong 3 phút - nhanh hơn 160 lần so với phương pháp truyền thống. Đây là dấu mốc quan trọng thách thức vị thế thống trị công nghệ của Mỹ.

https://www.gizmochina.com/2025/02/19/chinese-gpus-outperform-nvidia-in-supercomputing-a-challenge-to-us-tech-dominance/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-02-20 16:14:27

Framework AI của Sakana tăng tốc GPU lên 100 lần với CUDA Engineer tự động

Startup AI Nhật Bản Sakana AI ra mắt The AI CUDA Engineer - framework tự động phát hiện và tối ưu hóa CUDA kernel nhằm cải thiện hiệu suất GPU
Framework này có khả năng tạo CUDA kernel nhanh hơn từ 10 đến 100 lần so với các thao tác PyTorch thông thường và nhanh hơn 5 lần so với CUDA kernel đang được sử dụng trong sản xuất
CUDA là giao diện lập trình cấp thấp cho phép truy cập trực tiếp vào GPU NVIDIA để tính toán song song
Jim Fan, giám đốc nghiên cứu cấp cao tại NVIDIA đánh giá đây là agent lập trình tự động ấn tượng nhất gần đây
Framework hoạt động theo quy trình nhiều giai đoạn:
Chuyển đổi mã PyTorch thành CUDA kernel
Áp dụng tối ưu hóa tiến hóa
Sử dụng chiến lược "crossover" và "innovation archive" để cải thiện hiệu suất
Kết quả đạt được:
Đã chuyển đổi thành công hơn 230/250 thao tác PyTorch được đánh giá
Tạo ra hơn 30.000 CUDA kernel
17.000 kernel đã được xác minh tính chính xác
50% kernel có hiệu suất vượt trội so với PyTorch nguyên bản
Sakana AI đã công bố:
Bộ dữ liệu theo giấy phép CC-By-4.0 trên Hugging Face
Website tương tác cho phép người dùng khám phá dữ liệu và bảng xếp hạng kernel đã tối ưu
Cung cấp mã nguồn kernel, số liệu hiệu suất và các thử nghiệm tối ưu hóa liên quan

📌 Framework AI CUDA Engineer của Sakana đã chứng minh khả năng tăng tốc GPU lên đến 100 lần, với 17.000 kernel được xác thực và 50% vượt trội so với PyTorch. Đây là bước tiến quan trọng trong việc tự động hóa tối ưu hóa CUDA kernel thông qua AI.

https://analyticsindiamag.com/ai-news-updates/sakanas-ai-cuda-engineer-delivers-up-to-100x-speed-gains-over-pytorch/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute AI pháp lý-quản trị-chủ quyền 2025-02-20 14:12:38

Đông Nam Á có thể mất cơ hội thành trung tâm AI vì lệnh cấm chip của Mỹ

Sắc lệnh hành pháp 14141 của Tổng thống Biden hạn chế xuất khẩu chip AI cao cấp, ảnh hưởng đến các startup AI ở Đông Nam Á phụ thuộc vào dịch vụ đám mây
Singapore bị điều tra liên quan đến việc startup DeepSeek của Trung Quốc mua chip Nvidia qua bên thứ ba
Malaysia đã đầu tư 21,7 tỷ USD vào trung tâm dữ liệu trong 2 năm qua
Singapore cam kết chi 740 triệu USD hỗ trợ phát triển AI trong 5 năm tới
Theo quy định mới, công ty AI Mỹ phải giữ:
50% năng lực tính toán ở Mỹ
25% được triển khai ở các nước đồng minh (Tier 1)
7% cho các nước Tier 2 (bao gồm hầu hết quốc gia Đông Nam Á)
Cấm bán chip cho 22 quốc gia Tier 3
Các chuyên gia nhận định:
Tác động ngắn hạn sẽ ít do khu vực hiện có đủ năng lực tính toán
Có thể đẩy các công ty về phía công nghệ Trung Quốc
Hyperscaler có thể rút GPU về Mỹ, Nhật, Đài Loan
Startup có thể di chuyển đến các nước Tier 1
Thế hệ chip Nvidia mới dự kiến nhanh hơn 3-5 lần, công ty không tuân thủ quy định sẽ gặp khó khăn trong việc tiếp cận
Các nước như Thái Lan, Indonesia, Vietnam có thể bị ảnh hưởng nếu hyperscaler xem xét lại kế hoạch mở rộng

📌 Quy định hạn chế chip AI mới của Mỹ có thể làm chậm tham vọng trở thành trung tâm AI của Đông Nam Á. Khu vực đã đầu tư lớn với 21,7 tỷ USD từ Malaysia và 740 triệu USD từ Singapore, nhưng đối mặt nguy cơ mất cơ hội phát triển và đẩy các công ty về phía công nghệ Trung Quốc.

https://www.techinasia.com/chips-stacked-against-sea-new-rules-may-hinder-ai-boom-in-region

#TechinAsia

Đông Nam Á gặp khó trong cuộc đua AI? Quy định mới có thể cản trở sự bùng nổ AI trong khu vực

Những quy định mới của Mỹ về chip AI đã gây ra sự hoang mang trong ngành công nghệ Đông Nam Á vào tháng trước, khi các công ty chạy đua để tìm hiểu tác động của chúng đối với khu vực.

Sắc lệnh hành pháp 14141 của Mỹ, được Tổng thống Joe Biden ký vào tuần cuối cùng trước khi rời nhiệm sở, hạn chế xuất khẩu chip AI cao cấp.

Chính sách này có thể gây ra vấn đề nghiêm trọng cho các nhà phát triển AI, do hầu hết startup trong khu vực đều dựa vào các dịch vụ AI đám mây sử dụng những con chip cao cấp này.

Trung tâm kinh doanh của Đông Nam Á, Singapore, gần đây đã bị Mỹ đưa vào danh sách điều tra về việc startup AI Trung Quốc DeepSeek có mua chip Nvidia cao cấp từ bên thứ ba hay không.

Những người trong ngành được Tech in Asia phỏng vấn đồng tình rằng tác động ngắn hạn của quy định mới sẽ không quá lớn.

Các lô hàng chip đã được vận chuyển đến khu vực này sẽ vẫn ở lại đây. Đồng thời, cũng có những nghi vấn liệu chính quyền Trump có giữ nguyên các hạn chế này hay không.

Tuy nhiên, trong dài hạn, nếu quy định này vẫn duy trì, tham vọng trở thành trung tâm AI của Đông Nam Á có thể chậm lại. Điều này có thể đẩy khu vực vào thế phải hợp tác với các nhà cung cấp chip Trung Quốc.

Sắc lệnh 14141 vẫn giữ nguyên

Hiện tại, ngành công nghệ đang tập trung vào quyết định của Tổng thống Donald Trump. Ngay khi nhậm chức, ông đã hủy bỏ nhiều sắc lệnh của Biden. Tuy nhiên, sắc lệnh hành pháp 14141 vẫn chưa bị động đến.

"Không ai có thể đoán trước Trump sẽ làm gì," một nguồn tin giấu tên cho biết. "Ông ấy có thể bãi bỏ một số điều khoản hoặc thậm chí siết chặt hơn nữa. Cũng có thể ông ấy chỉ dùng nó như một con bài thương lượng."

Tác động ngay lập tức của quy định mới cũng không lớn vì Đông Nam Á hiện vẫn có đủ năng lực để đáp ứng nhu cầu AI hiện tại.

Dù vậy, các nhà đầu tư và startup trong khu vực vẫn lo lắng về khả năng căng thẳng Mỹ - Trung leo thang sẽ ảnh hưởng đến ngành AI.

Malaysia đã đầu tư 21,7 tỷ USD vào các trung tâm dữ liệu trong 2 năm qua, theo dữ liệu từ Tập đoàn Kinh tế Kỹ thuật số Malaysia.

Trong khi đó, Singapore cam kết chi hơn 740 triệu USD để hỗ trợ phát triển AI trong 5 năm tới. Năm 2019, đảo quốc này tuyên bố mục tiêu trở thành trung tâm AI khu vực.

Hiện nay, hầu hết các trung tâm dữ liệu ở Đông Nam Á không tham gia vào việc phát triển mô hình AI tạo sinh (genAI), theo Matthew Walker, chuyên gia phân tích chính tại MTN Consulting ở Bangkok.

Việc phát triển mô hình genAI là phần tiêu tốn nhiều tài nguyên tính toán nhất khi đào tạo mô hình ngôn ngữ lớn. Hầu hết startup trong khu vực chỉ tham gia vào quá trình tinh chỉnh (fine-tuning), vốn ít tiêu tốn tài nguyên hơn.

“Hạn chế này sẽ có rất ít tác động ngay lập tức vì việc phát triển mô hình AI chủ yếu vẫn diễn ra ở Mỹ,” Walker giải thích.

Nguồn tin giấu tên chia sẻ rằng hầu hết startup họ trao đổi đang áp dụng chiến lược “chờ xem”, vì vẫn còn thời gian trước khi quy định có hiệu lực.

Hiện tại, lệnh hạn chế đang trong giai đoạn bình luận kéo dài 120 ngày, cho phép Cục Công nghiệp và An ninh thuộc Bộ Thương mại Mỹ điều chỉnh nếu cần thiết. Nvidia đã chính thức phản đối quy định này.

“Chưa ai thực hiện động thái lớn nào, nhưng họ đã bắt đầu bàn về nó,” nguồn tin cho hay.

Theo quy định mới, các công ty AI có trụ sở tại Mỹ cung cấp dịch vụ đám mây phải giữ lại 50% năng lực tính toán trong nước. 25% khác được phép triển khai tới các đồng minh thân cận của Mỹ (nhóm Tier 1).

Trong số năng lực tính toán còn lại, 7% có thể được triển khai tới các quốc gia thuộc nhóm Tier 2 – trong đó có tất cả các nước lớn ở Đông Nam Á, nhưng với các quy định nghiêm ngặt hơn nhiều.

Trong khi đó, quy định cấm bán hoặc chuyển giao chip AI cao cấp cho 22 quốc gia thuộc nhóm Tier 3.

Nhiều ngoại lệ

Như thường thấy với các sắc lệnh hành pháp, có nhiều ngoại lệ. Các công ty có trụ sở bên ngoài Mỹ có thể mua và sở hữu các chip vượt quá giới hạn nếu đạt trạng thái Người dùng cuối được xác minh quốc gia (National Verified End User).

Những người trong ngành lưu ý rằng chi tiết về các ngoại lệ này vẫn chưa được công bố. Tuy nhiên, một quy tắc khá rõ ràng: không được giao dịch với các công ty Nga, Triều Tiên hoặc Trung Quốc.

Dù vậy, các chuyên gia cũng cho rằng dù quy định này có thể làm chậm hoặc đẩy các startup Trung Quốc ra khỏi các máy chủ AI đám mây của Đông Nam Á, nó khó có thể ngăn chặn hoàn toàn việc chuyển nhượng chip trái phép.

Một hệ quả ngoài mong muốn là các công ty Đông Nam Á có thể khó chịu với các hạn chế này và quyết định sử dụng chip và mô hình đào tạo của Trung Quốc.

Đây chính là điều Mỹ muốn tránh, vì Washington muốn các startup dựa vào công nghệ Mỹ, theo Alex Yeh, đồng sáng lập kiêm CEO GMI Cloud – một nhà cung cấp dịch vụ AI đám mây có trụ sở tại Mỹ với các trung tâm dữ liệu ở Malaysia, Thái Lan và Đài Loan.

Ông cảnh báo rằng nếu các quy định này buộc các công ty chuyển sang công nghệ Trung Quốc, điều đó sẽ giúp các doanh nghiệp Trung Quốc phát triển nhanh hơn và độc lập hơn.

Các chuyên gia dự đoán Trung Quốc có thể tận dụng cơ hội này để gia tăng ảnh hưởng công nghệ trong khu vực.

Khi thừa vẫn chưa đủ

Hiện tại, các bên liên quan trong ngành AI tại Malaysia và Singapore cho rằng họ đã có đủ năng lực tính toán AI để đối phó với bất kỳ hạn chế nào từ Mỹ.

Một nguồn tin giấu tên nói với Tech in Asia rằng các trung tâm hiện có và sắp xây dựng ở các quốc gia này được thiết kế để có dư công suất và đáp ứng nhu cầu ngày càng tăng.

“Tại thời điểm này, nhu cầu tính toán trong Malaysia và Singapore vẫn thấp hơn rất, rất nhiều so với năng lực hiện tại,” nguồn tin cho biết. Họ dự đoán khu vực này sẽ không đạt đến giới hạn công suất hiện có trong ít nhất 10 năm tới.

Tuy nhiên, không phải ai cũng đồng tình.

Yeh từ GMI Cloud tin rằng các hạn chế có thể bắt đầu ảnh hưởng chỉ trong một năm. Công ty của ông hợp tác chặt chẽ với Nvidia và là một phần trong mạng lưới đối tác của tập đoàn này.

Ông cho rằng các công ty không tuân thủ quy định sẽ gặp khó khăn khi thế hệ chip Nvidia mới – được dự đoán có tốc độ nhanh gấp 3 đến 5 lần hiện tại – ra mắt.

“Người ta sẽ bỏ ra số tiền tương tự nhưng làm được nhiều gấp 5 lần so với bạn,” ông giải thích.

Ông cũng dự đoán rằng các tập đoàn điện toán đám mây quy mô lớn như Amazon, Apple, Google, Meta và Microsoft có thể chuyển công suất GPU về các nền kinh tế tiên tiến hơn như Mỹ, Nhật Bản hoặc Đài Loan.

Điều này có thể tác động nghiêm trọng đến các nước như Thái Lan, Indonesia và Việt Nam – những nơi đang thúc đẩy phát triển AI và xây dựng trung tâm dữ liệu.

Helen Chiang, trưởng bộ phận nghiên cứu bán dẫn tại IDC Asia/Pacific, cho rằng tình trạng này có thể dẫn đến làn sóng startup rời khỏi Đông Nam Á.

“Việc này sẽ tác động đến sự phát triển AI trong khu vực như thế nào vẫn còn là điều đáng theo dõi,” bà nói với Tech in Asia.

Chips stacked against SEA? New rules may hinder AI boom in region
Confusion over new US AI chip restrictions dampened Southeast Asia’s AI party last month as the industry scrambled to understand what they would mean for the region.

US Executive Order 14141, signed by President Joe Biden in his last week in office, limits the export of high-end AI chips.

The directive could pose serious problems for AI developers as most startups in the region rely on cloud-based AI services powered by these high-end chips.

Southeast Asia’s business hub, Singapore, has recently been included in a US investigation into whether Chinese AI startup DeepSeek purchased advanced Nvidia chips from third parties.

Industry insiders interviewed by Tech in Asia agree that the short-term effect of the new rules will likely be minimal.

Chips already shipped to the region will stay there for now. At the same time, there are questions on whether the Trump administration will retain the restrictions.
There are also concerns about longer-term growth if the rules stay in place. Southeast Asia’s ambitions to become an AI hub will likely slow down. However, this may end up pushing the region into the arms of Chinese chip players.

14141 intact
Most of the industry is currently focused on what President Donald Trump will do. The day he took office, he began to undo many of Biden’s orders. However, Executive Order 14141 remains untouched.

“It’s pretty much impossible to predict what Trump would do, actually,” says an insider who asked not to be named. “He might roll back some of these provisions or he might escalate them even more. He might just use it as bargaining chips.”
Any immediate effect is also likely to be limited because Southeast Asia currently has more than enough capacity to cope with the existing demand for AI services.

Yet, investors and startups in the area still worry about what an escalation in US-China tensions could mean for the region’s AI industry.

Malaysia has invested US$21.7 billion in data centers in the past two years, information from Malaysia Digital Economy Corporation reveals.

Singapore, on the other hand, has pledged to allocate over US$740 million to support AI development in the next five years. In 2019, the city-state declared its goal to become a regional hub for AI development.
Right now, most of the data centers in Southeast Asia are not involved in the development of generative AI models, Matthew Walker, chief analyst at MTN Consulting in Bangkok, tells Tech in Asia.

The development of genAI models is the most computing-intensive part of training a large language model. Most startups in the region are involved in the fine-tuning process, which is less intensive.

“The restrictions will have little immediate effect because AI model development is already based primarily in the US,” Walker explains.

The unnamed insider shares that most of the startups they have talked to are taking a wait-and-see approach and that there’s time before the rules take effect.
The restrictions are currently in a 120-day comment phase, which allows the US Department of Commerce’s Bureau of Industry and Security to alter them if necessary. Nvidia has officially opposed the rules.

“No one’s making big moves yet, but they’re already talking about it,” the insider says.
Under the new restrictions, US-headquartered AI companies offering cloud services are required to keep half of their computing power in the country. Another 25% is allowed to be deployed to US close allies. This group is called Tier 1.

Of the firms’ remaining computing power, 7% can be deployed to most other countries that belong to Tier 2. This group, which includes every major country in Southeast Asia, faces much stricter regulations.

Meanwhile, the rules prevent the sale or transfer of high-end AI chips to the 22 countries listed under Tier 3.
Many exceptions
There are, as is common with executive orders, lots of exemptions. Companies based outside the US can buy and hold chips that exceed these caps if they get the National Verified End User status.

The insiders interviewed by Tech in Asia note that the details of these exemptions haven’t been announced yet. However, one rule appears particularly clear: no dealings with Russian, North Korean, or Chinese companies.
Yet, these insiders also note that while the rules might slow down or force out Chinese startups from Southeast Asia’s AI cloud servers, they probably wouldn’t stop the illegal transfer of chips to these firms.

An unintended consequence is that Southeast Asian firms may chafe at the restrictions and decide to use Chinese training models and chips instead.

That’s something the US wants to avoid as it wants startups to rely on American technologies, according to Alex Yeh, co-founder and CEO of GMI Cloud, a US-headquartered AI cloud service provider with data centers in Malaysia, Thailand, and Taiwan.
He warns that if the restrictions force companies to adopt Chinese tech, it will just allow Chinese players to grow faster and be more independent.

Analysts expect that China will likely use the restrictions as an opportunity to increase its tech presence in the region.

When too much is not enough
For now, stakeholders in Malaysia’s and Singapore’s AI industries think they already have enough AI-grade computing capacity in their countries to weather any US restrictions.

The unnamed insider tells Tech in Asia that the existing and upcoming centers in these countries were built to have excess capacity and handle growing demand.
“As of now, the amount of computing demand within Malaysia, within Singapore, is far, far, far less than what’s been built,” the insider adds. They don’t expect the region to reach its current maximum capacity for at least 10 years.

Not everyone agrees, however.

GMI Cloud’s Yeh thinks the restrictions could begin to have an impact in as little as one year. His company works closely with Nvidia and is part of the tech giant’s partner network.

Yeh says companies that fail to comply with the rules and are facing restrictions will struggle when the new generation of Nvidia chips, which are estimated to be 3x or 5x faster than what it currently offers, hit the market.

“So people will be able to spend the same amount of money and get 5x things done faster than you,” he explains.

He also anticipates that hyperscalers – including Amazon, Apple, Google, Meta, and Microsoft – could move their GPU capacity to more advanced economies.
Hyperscalers may bring their chips back to the US, Japan, or Taiwan. But these chips are unlikely to be replaced, thereby reducing the region’s computing capacity.

This scenario could also have a serious effect on countries like Thailand, Indonesia, and Vietnam. All three have been pushing to develop AI and bring in data centers. If hyperscalers are pulling back, it could mean they are reconsidering their expansion plans in these countries.
Helen Chiang, head of semiconductor research at IDC Asia/Pacific, points out that this could lead to an exodus of startups from Southeast Asia.

She says if firms based in the region – which are aggressively developing AI – need to get US approval to get access to chips, they may think it’s more efficient to move to a Tier 1 country and set up headquarters there.

“How this will impact local AI development is worth watching,” she tells Tech in Asia.

Không có file đính kèm.

Nguồn tham khảo

141

Semi-Cloud-DC-Green AI chips-hardware-compute 2025-02-20 11:10:26

Ả Rập Saudi rót 5 tỷ USD vào siêu dự án trung tâm dữ liệu AI xanh tại thành phố tương lai Neom

Công ty phát triển trung tâm dữ liệu DataVolt của Ả Rập Saudi đầu tư 5 tỷ USD xây dựng khuôn viên trung tâm dữ liệu AI phát thải ròng bằng 0 tại Neom
Dự án nằm trong khu công nghiệp Oxagon thuộc Neom - thành phố tương lai ở phía bắc Biển Đỏ
Neom là một phần của Tầm nhìn 2030 của Ả Rập Saudi nhằm đa dạng hóa nền kinh tế, giảm phụ thuộc vào doanh thu từ nhiên liệu hóa thạch
Công suất mục tiêu của cơ sở là 1,5 GW, hoàn toàn được cung cấp từ nguồn năng lượng tái tạo
Giai đoạn đầu tiên với khoản đầu tư 5 tỷ USD dự kiến hoàn thành vào năm 2028
Oxagon sẽ có quyền tiếp cận các nguồn năng lượng tái tạo cạnh tranh về chi phí, bao gồm hydro xanh và kết nối cáp quang dưới biển
Trung tâm dữ liệu được thiết kế để hỗ trợ khối lượng công việc AI bằng cách tích hợp nhiều mật độ điện toán và kiến trúc tiết kiệm năng lượng
Các trung tâm dữ liệu hiện tiêu thụ khoảng 1-2% điện năng toàn cầu
Để đạt được mục tiêu phát thải ròng bằng 0, cần xem xét toàn bộ vòng đời của trung tâm dữ liệu:
Lựa chọn vật liệu phát thải carbon thấp
Áp dụng thiết kế dễ nâng cấp
Áp dụng chiến lược tái chế và tái sử dụng để giảm thiểu chất thải
Các phương pháp cách mạng bao gồm:
Sử dụng pin quy mô tiện ích để lưu trữ năng lượng tái tạo
Áp dụng pin nhiên liệu hydro

📌 Ả Rập Saudi đầu tư 5 tỷ USD vào trung tâm dữ liệu AI tại Neom với công suất 1,5 GW hoàn toàn từ năng lượng tái tạo. Dự án dự kiến hoàn thành năm 2028, đánh dấu bước tiến quan trọng trong việc xây dựng cơ sở hạ tầng điện toán hiệu năng cao bền vững.

https://www.datacenterknowledge.com/sustainability/net-zero-ai-data-center-project-gets-a-5b-boost-in-saudi-arabia

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-02-19 00:08:59

Singapore tiết lộ: Chỉ mua 1% chip Nvidia, trong lúc Mỹ điều tra DeepSeek Trung Quốc

- Singapore chỉ chiếm chưa đến 1% tổng doanh thu của Nvidia trong quý kết thúc vào tháng 10/2024, theo chia sẻ của Bộ trưởng thứ hai về Thương mại và Công nghiệp Tan See Leng

- Mặc dù Nvidia ghi nhận 22% doanh số bán hàng từ Singapore trong giai đoạn tháng 8-10/2024, nhưng đây chỉ là nơi khách hàng của Nvidia nhận hóa đơn

- Chính quyền Mỹ đang điều tra liệu DeepSeek, startup AI của Trung Quốc, có mua chip Nvidia cao cấp thông qua bên thứ ba tại Singapore để vượt qua hạn chế của Washington

- DeepSeek gần đây đã ra mắt chatbot R1, có hiệu suất tương đương với các công cụ của Mỹ, cho thấy Trung Quốc đang tiến xa hơn dự kiến trong cuộc đua AI

- Nvidia đã chỉ ra rằng họ không nghĩ DeepSeek vi phạm kiểm soát xuất khẩu

- Singapore khẳng định hải quan nước này làm việc chặt chẽ với các đối tác nước ngoài, bao gồm Mỹ, để hỗ trợ điều tra khi cần thiết

- Chính phủ Singapore tuyên bố không dung túng các doanh nghiệp lợi dụng quan hệ với Singapore để phá vỡ kiểm soát xuất khẩu của các nước khác

📌 Singapore chỉ chiếm dưới 1% doanh thu Nvidia, mặc dù 22% doanh số được ghi nhận tại đây do tập trung hóa đơn. Trong khi đó, chatbot R1 của DeepSeek đạt hiệu suất ngang với công cụ của Mỹ, khiến Washington lo ngại về việc tiếp cận chip AI cao cấp của Trung Quốc.

https://fortune.com/asia/2025/02/18/singapore-buys-small-amount-nvidia-chips-official-says/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-02-17 00:44:22

CEO Mistral kêu gọi châu Âu đầu tư vào cơ sở hạ tầng AI

- CEO Mistral Arthur Mensch kêu gọi châu Âu tăng cường đầu tư vào cơ sở hạ tầng AI tại hội nghị Visionaries Unplugged ở Paris

- Nhiều nhà lãnh đạo công nghệ hàng đầu tham dự hội nghị như:
+ Demis Hassabis - nhà sáng lập DeepMind
+ Reid Hoffman - đồng sáng lập LinkedIn
+ Dario Amodei - nhà sáng lập Anthropic
+ Eric Schmidt - cựu CEO Google

- Eric Schmidt nhận định tham vọng của châu Âu không thua kém Mỹ, vấn đề nằm ở cơ cấu chứ không phải nhân tài

- Tỷ phú công nghệ Pháp Xavier Niel cảnh báo:
+ Các mô hình AI từ Mỹ và Trung Quốc không phù hợp với lối sống châu Âu
+ Công ty viễn thông Iliad của ông cam kết đầu tư 3 tỷ euro phát triển AI tại Pháp

- Các nhà sáng lập và nhà đầu tư kêu gọi quy định AI ở châu Âu cần:
+ Đủ linh hoạt để hỗ trợ đổi mới
+ Tăng cường khả năng cạnh tranh

- EU đang thúc đẩy Luật AI:
+ Có hiệu lực từ năm ngoái
+ Thiết lập quy tắc quản lý AI dựa trên mức độ rủi ro
+ Đảm bảo triển khai công nghệ an toàn, minh bạch và đạo đức

- Phó tổng thống Mỹ JD Vance chỉ trích nỗ lực quản lý AI của EU tại Hội nghị thượng đỉnh AI ở Paris, khẳng định chính quyền Trump sẽ không chấp nhận các chính phủ nước ngoài "siết chặt" các công ty công nghệ Mỹ

📌 Châu Âu đang đối mặt với nguy cơ tụt hậu trong cuộc đua AI toàn cầu. Trong khi EU áp đặt quy định chặt chẽ, Mỹ nới lỏng bảo vệ AI và trao quyền cho các lãnh đạo công nghệ. Khoản đầu tư 3 tỷ euro của Iliad là động thái quan trọng nhằm thúc đẩy phát triển AI tại châu Âu.

https://thenextweb.com/news/mistral-ceo-wants-europe-to-own-ai-infrastructure

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-02-13 15:08:23

DeepSeek mở ra cơ hội mới cho các nhà sản xuất chip AI Trung Quốc

- DeepSeek đang tạo cơ hội cho các nhà sản xuất chip Trung Quốc như Huawei cạnh tranh tốt hơn trong thị trường nội địa với các bộ xử lý của Mỹ

- Mô hình DeepSeek tập trung vào "suy luận" - giai đoạn AI đưa ra kết luận, thay vì chỉ dựa vào sức mạnh xử lý thuần túy

Nhiều công ty chip AI Trung Quốc đã công bố hỗ trợ mô hình DeepSeek:
- Huawei
- Hygon
- EnFlame (được Tencent hậu thuẫn)
- Tsingmicro
- Moore Threads

Chip Ascend 910B của Huawei được ByteDance đánh giá phù hợp với các tác vụ "suy luận" đòi hỏi ít tính toán

- Hàng chục công ty Trung Quốc từ ô tô đến viễn thông đã lên kế hoạch tích hợp mô hình DeepSeek

Chip AI Trung Quốc có lợi thế cạnh tranh về giá trong thị trường nội địa, tuy nhiên:
- Chỉ giới hạn ở thị trường Trung Quốc
- Nvidia vẫn vượt trội cả trong tác vụ suy luận

Nvidia vẫn duy trì ưu thế nhờ:
- Được phép bán chip training ít mạnh hơn vào Trung Quốc
- Nền tảng CUDA giúp lập trình viên tận dụng GPU cho điện toán đa mục đích
- Thư viện phong phú và khả năng phần mềm đa dạng

- Huawei đang nỗ lực cạnh tranh với CUDA thông qua kiến trúc CANN (Compute Architecture for Neural Networks) nhưng gặp khó khăn trong việc thuyết phục các nhà phát triển

📌 DeepSeek đang mở ra cơ hội cho ngành công nghiệp chip AI Trung Quốc thông qua tối ưu hóa suy luận, tuy nhiên Nvidia vẫn dẫn đầu nhờ ưu thế về phần mềm CUDA và thư viện phong phú. Các công ty như Huawei đang tích cực phát triển giải pháp thay thế như CANN để giảm phụ thuộc vào công nghệ Mỹ.

https://www.reuters.com/technology/artificial-intelligence/deepseek-gives-chinas-chipmakers-leg-up-race-cheaper-ai-2025-02-13/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green AI viễn thông 2025-02-13 10:34:15

Quan hệ giữa AI và trung tâm dữ liệu, tính bền vững trong ngành viễn thông

- AI đang tạo ra thách thức lớn về bền vững do khối lượng công việc tiêu tốn nhiều năng lượng, tuy nhiên cũng mang lại tiềm năng cải thiện hiệu quả hoạt động

- Orange Poland áp dụng AI để tối ưu hóa ăng-ten 5G, giúp giảm 20-25% lượng điện tiêu thụ trong cơ sở hạ tầng mạng

- So với tìm kiếm Google thông thường, một truy vấn AI tạo sinh thải ra lượng khí CO2 cao hơn 100%

- T-Mobile US đang quản lý khoảng 100 trung tâm dữ liệu, phải cân bằng giữa chi phí, công suất, kiểm soát khí thải và rủi ro vận hành

- Tại Ireland, các trung tâm dữ liệu tiêu thụ hơn 20% tổng điện năng của cả nước, dẫn đến lệnh cấm xây mới gần Dublin đến năm 2028

- T-Mobile US phát hiện 40-50% CPU hoạt động không hiệu quả, lãng phí năng lượng khi không thực hiện công việc

- Bộ nhớ chiếm khoảng 20% điện năng tiêu thụ trong trung tâm dữ liệu

Các giải pháp được đề xuất:
+ Chỉ sử dụng AI khi thực sự cần thiết
+ Tối ưu hóa hiệu suất tính toán
+ Điều phối khối lượng công việc thông minh hơn
+ Hiện đại hóa thiết bị để tăng hiệu quả năng lượng
+ Áp dụng các khái niệm kinh tế tuần hoàn

📌 Trung tâm dữ liệu đang đối mặt với áp lực kép từ nhu cầu tính toán AI và giới hạn nguồn điện. Một truy vấn AI tạo sinh thải CO2 gấp đôi tìm kiếm thông thường. Ireland phải cấm xây mới trung tâm dữ liệu do tiêu thụ 20% điện toàn quốc.

https://www.rcrwireless.com/20250106/fundamentals/ai-data-centers

Không có file đính kèm.

Nguồn tham khảo

111

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-02-13 10:29:25

Báo cáo DC năm 2025: 80% DC dự kiến tăng công suất vì AI, năng lượng hạt nhân lên ngôi

Báo cáo Trung tâm Dữ liệu 2025 (do AFCOM công bố) cho thấy ngành trung tâm dữ liệu đang bước vào thời kỳ bùng nổ, đặc biệt do nhu cầu AI tạo sinh ngày càng cao. 80% chuyên gia dự đoán nhu cầu dung lượng sẽ tăng mạnh, trong khi 64% đang triển khai hạ tầng có khả năng hỗ trợ AI.
Mỗi tháng từ cuối năm 2021 đến nay, ngành đã thêm hơn 100 MW công suất xây dựng mới. Tỷ lệ lấp đầy đạt mức kỷ lục chỉ còn 3%, với tốc độ tăng trưởng chiếm dụng 30%/năm từ năm 2020.
Quy mô trung bình trung tâm dữ liệu được xây mới là 32MW, và số lượng dự kiến xây dựng mới trong 3 năm tới tăng gấp 6 lần.
33% tổ chức chọn mô hình xây dựng lai – kết hợp giữa mô-đun tiền chế và phương pháp truyền thống. Tỷ lệ áp dụng mô-đun IT và làm mát tiền chế tăng lên 83%, phản ánh xu hướng thiết kế linh hoạt và tối ưu thời gian triển khai.
Trong chiến lược DCIM, việc tích hợp AR/VR và hệ thống thông minh tăng mạnh từ 16% (2020) lên dự kiến 69% (2025), giúp tăng cường khả năng giám sát và điều hành trung tâm dữ liệu.
Các ưu tiên DCIM gồm: bảo mật (66%), quản lý năng lượng (53%), quản lý cáp (58%) và theo dõi tài sản (63%).
Mật độ rack trung bình tăng từ 7 kW (2021) lên 16 kW (2025), do yêu cầu xử lý cao từ AI. 68% tổ chức đang nâng cấp làm mát, với 46% áp dụng giải pháp làm mát bằng chất lỏng như bộ trao đổi nhiệt phía sau hoặc làm mát trực tiếp chip.
71% đang triển khai các biện pháp bảo tồn năng lượng và nước; 36% áp dụng giải pháp làm mát không dùng nước. 33% trung tâm dữ liệu đã hoặc sẽ dùng năng lượng hạt nhân, đặc biệt là SMR (Small Modular Reactor) – một dạng lò phản ứng tiên tiến công suất nhỏ.
Amazon, Microsoft và Google đều đầu tư dài hạn vào nguồn điện hạt nhân với hợp đồng PPA trị giá hàng tỷ USD. AWS đã mua khu trung tâm dữ liệu 960MW sử dụng điện hạt nhân ở Pennsylvania.
62% tổ chức đang cân nhắc hoặc sử dụng phát điện tại chỗ nhằm giảm phụ thuộc vào lưới điện, tăng hiệu quả và khả năng tự chủ.
Xu hướng repatriation đám mây (di chuyển khối lượng công việc về on-premise) tăng từ 59% (2022) lên 80% (2025), nguyên nhân chính là chi phí đám mây tăng cao và hiệu suất không ổn định.
Các khối lượng công việc quay trở lại nhiều nhất gồm: lưu trữ, phân tích dữ liệu, AI, bảo mật, và IoT. Điều này tạo áp lực lớn lên điện năng và làm mát, buộc các tổ chức nâng cấp cơ sở hạ tầng.
Nguy cơ bảo mật gia tăng: 60% lo ngại ransomware, 57% lo về mối đe dọa con người, 48% lo về tấn công APT. 78% đã thay đổi yêu cầu bảo mật vật lý trong 24 tháng qua, tăng camera giám sát và kiểm tra nhà thầu kỹ hơn.
85% tổ chức bị ảnh hưởng bởi thiếu hụt nhân lực, dẫn đến chậm tiến độ dự án. Vai trò cần tuyển nhiều nhất gồm: vận hành viên đa năng (58%), kỹ sư trung tâm dữ liệu (50%), chuyên gia an ninh (44%).
Chi phí vận hành tăng (64%), chủ yếu do điện (65%), nhân sự (59%), bản quyền phần mềm (52%). Vốn đầu tư tăng 60%, tập trung vào nâng cấp cơ sở hiện tại, làm mới IT và mở rộng trung tâm dữ liệu.

📌 Ngành trung tâm dữ liệu năm 2025 đang chuyển mình mạnh mẽ với sức ép từ AI: 80% doanh nghiệp tăng dung lượng để phục vụ AI tạo sinh, 33% chuyển sang năng lượng hạt nhân, và 83% áp dụng mô-đun tiền chế. Xu hướng repatriation đám mây đạt 80%, làm tăng tải điện và đòi hỏi làm mát chất lỏng. Đồng thời, thiếu hụt nhân sự ảnh hưởng đến 85% tổ chức. Đây là thời điểm quyết định để đổi mới và dẫn đầu thị trường số.

https://datacenterworld.com/press-releases/2025-state-of-the-data-center-industry-report

Tóm tắt chi tiết nội dung liên quan đến AI trong Báo cáo Trung tâm Dữ liệu 2025:

AI là nhân tố trung tâm định hình lại toàn bộ ngành trung tâm dữ liệu, từ thiết kế cơ sở hạ tầng, tiêu thụ năng lượng, đến cách các tổ chức đầu tư, quản lý và triển khai tài nguyên.
64% tổ chức cho biết đang triển khai các giải pháp có khả năng chạy AI, tăng từ 56% năm trước. Trong đó:
- 47% hướng đến hỗ trợ AI tạo sinh (GenAI).
- 44% muốn tạo ra dịch vụ mới dựa trên AI.
- 40% phục vụ cho các use case nội bộ doanh nghiệp.
- 32% hướng đến giảm chi phí đám mây nhờ AI hạ tầng riêng.
AI tạo sinh, đặc biệt là LLM như ChatGPT, đòi hỏi hạ tầng chuyên biệt: GPU, hệ thống làm mát công suất cao, dung lượng lớn. 76% doanh nghiệp cho biết đang chuẩn bị cho yêu cầu hạ tầng này.
80% chuyên gia tin rằng AI sẽ làm tăng đáng kể công suất yêu cầu tại các trung tâm dữ liệu colocation, trong đó 40% cho rằng mức tăng là "rất lớn".
39% đã và đang tăng công suất điện để hỗ trợ AI, trong khi 37% nâng cấp hệ thống làm mát.
GPUaaS (GPU-as-a-Service) là mô hình mới nổi bật, mặc dù hiện mới chỉ 15% triển khai, nhưng 36% có kế hoạch triển khai trong 3 năm tới. Điều này mở ra hướng dịch vụ mới cho các nhà cung cấp hạ tầng.
Tăng mật độ rack phục vụ AI là xu hướng bắt buộc: trung bình từ 7 kW (2021) đã lên đến 16 kW/rack (2025). 79% tổ chức kỳ vọng tiếp tục tăng nữa.
46% đang chuyển sang làm mát bằng chất lỏng, với nhiều kiểu như:
- Bộ trao đổi nhiệt phía sau (47%).
- Làm mát trực tiếp chip 1 pha (43%).
- Nhúng 1 pha hoặc 2 pha.
DCIM tích hợp AI và AR/VR để quản lý thông minh hơn:
- 2020: 16% dùng AR/VR
- 2025: dự kiến 69% tích hợp
- Đây là bước đệm cho tự động hóa bằng AI-native trong quản trị trung tâm dữ liệu.
AI ảnh hưởng đến chiến lược hybrid cloud: 80% tổ chức đang repatriate workloads về on-premise do nhu cầu AI và chi phí cloud. AI workloads như huấn luyện và suy luận LLM là nhóm quay về nhiều nhất.
Top 5 workload AI quay lại on-premise nhiều nhất:
- 44%: Lưu trữ và phục hồi dữ liệu AI.
- 35%: Máy ảo và ứng dụng AI.
- 32%: Web ứng dụng AI-driven.
- 30%: Workload LLM training và inference.
- 29%: IoT/Edge phục vụ AI thời gian thực.
AI kéo theo tăng CAPEX/OPEX: 64% tổ chức tăng chi phí vận hành, chủ yếu do điện năng phục vụ AI, làm mát và hạ tầng GPU. 60% tăng đầu tư vốn vào mở rộng và làm mới hạ tầng để phục vụ các nhu cầu mới do AI gây ra.
AI tạo ra áp lực tuyển dụng và kỹ năng mới: các vai trò liên quan đến AI hạ tầng, làm mát, quản lý năng lượng, và bảo mật AI đang thiếu hụt nghiêm trọng. 85% tổ chức bị ảnh hưởng bởi thiếu nhân lực, ảnh hưởng tiến độ triển khai AI.

📌 AI đang "gây chấn động" ngành trung tâm dữ liệu: 64% doanh nghiệp đang triển khai hạ tầng AI, 80% dự đoán nhu cầu dung lượng tăng mạnh, và 76% đang điều chỉnh để hỗ trợ GenAI và LLM. GPUaaS, repatriation workloads AI, và làm mát bằng chất lỏng đang thay đổi mọi thứ – từ điện năng, ngân sách đến tuyển dụng kỹ sư AI. Không còn là tương lai – AI đã và đang tái định nghĩa trung tâm dữ liệu hôm nay.

Không có file đính kèm.

Nguồn tham khảo

156

AI chips-hardware-compute AI mở-nguồn mở 2025-02-11 20:44:10

CEO Baidu: Cần tiếp tục đầu tư hạ tầng AI dù DeepSeek đã chứng minh hiệu quả tiết kiệm

- Robin Li, CEO Baidu phát biểu tại Hội nghị thượng đỉnh chính phủ thế giới ở Dubai ngày 11/2/2025, nhấn mạnh việc đầu tư vào trung tâm dữ liệu và cơ sở hạ tầng đám mây vẫn rất cần thiết

- DeepSeek, một startup AI của Trung Quốc, gần đây gây chú ý khi phát triển các mô hình ngôn ngữ có hiệu suất tương đương với các hệ thống hàng đầu như OpenAI's GPT nhưng sử dụng ít năng lực tính toán hơn đáng kể

- Baidu là một trong những công ty Trung Quốc đầu tiên ra mắt sản phẩm AI sau khi ChatGPT được phát hành cuối năm 2022. Tuy nhiên, mô hình ngôn ngữ lớn Ernie của công ty, được cho là có khả năng tương đương GPT-4, chưa được người dùng đón nhận rộng rãi

- Trước đây, Li từng tuyên bố mạnh mẽ rằng khó có thể xuất hiện một công ty như OpenAI từ Trung Quốc và ủng hộ mô hình đóng là con đường duy nhất khả thi cho phát triển AI

- Tại hội nghị, Li thừa nhận sự xuất hiện bất ngờ của DeepSeek cho thấy bản chất khó đoán của đổi mới công nghệ

- Các hạn chế về năng lực tính toán đã thúc đẩy các công ty Trung Quốc đổi mới để giảm chi phí

- Li cũng thay đổi quan điểm về phát triển nguồn đóng, giờ đây công nhận cách tiếp cận nguồn mở có thể thúc đẩy việc áp dụng AI nhanh hơn

📌 Từ chỗ ủng hộ mạnh mẽ mô hình đóng, CEO Baidu Robin Li đã thay đổi quan điểm về AI nguồn mở sau thành công của DeepSeek. Mặc dù vậy, ông vẫn khẳng định cần tiếp tục đầu tư lớn vào cơ sở hạ tầng để phát triển các mô hình AI vượt trội.

https://www.reuters.com/technology/baidu-ceo-says-more-ai-spend-still-needed-despite-deepseeks-success-2025-02-11/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-02-11 20:40:08

Cuộc đua toàn cầu về hạ tầng điện toán AI

- Tổng thống Pháp Emmanuel Macron công bố thỏa thuận trị giá 30-50 tỷ euro với UAE để xây dựng khuôn viên AI và trung tâm dữ liệu tại Pháp

- Tổng thống Mỹ Donald Trump đã công bố dự án Stargate trị giá 500 tỷ USD để đầu tư vào hạ tầng AI, tuyên bố đây là dự án AI lớn nhất lịch sử

- Các chatbot như ChatGPT cần rất nhiều GPU (card đồ họa) để xử lý hàng triệu truy vấn mỗi ngày, đòi hỏi phải tập trung tại các trung tâm dữ liệu lớn

- Goldman Sachs dự báo nhu cầu điện toán cho chatbot của OpenAI, Meta và Anthropic sẽ tăng 160% từ nay đến năm 2026

- Các trung tâm dữ liệu hiện tại chưa sẵn sàng cho AI vì thiếu hạ tầng điện và hệ thống làm mát cần thiết

- Theo Cơ quan Năng lượng Quốc tế, đến năm 2030 nhu cầu điện của các trung tâm dữ liệu sẽ tương đương mức tiêu thụ hiện tại của Mỹ và EU cộng lại

- Châu Âu đang tụt hậu trong cuộc đua trung tâm dữ liệu, phần lớn các trung tâm tại châu Âu thuộc sở hữu của các tập đoàn Mỹ như Microsoft

- Việc xây dựng trung tâm dữ liệu gây tác động lớn đến môi trường do tiêu thụ nhiều điện năng và nước làm mát

- DeepSeek của Trung Quốc chứng minh có thể phát triển chatbot hiệu quả với ít năng lượng tính toán hơn nhiều so với đối thủ Mỹ

📌 Cuộc đua hạ tầng AI toàn cầu đang nóng lên với các khoản đầu tư khổng lồ: 500 tỷ USD từ Mỹ và 30-50 tỷ euro từ liên minh Pháp-UAE. Tuy nhiên, thách thức về môi trường và tiêu thụ năng lượng đặt ra câu hỏi về tính bền vững của mô hình phát triển này.

https://www.france24.com/en/technology/20250210-the-global-race-to-build-ai-computing-infrastructure

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute AI pháp lý-quản trị-chủ quyền 2025-02-10 01:02:34

CEO Anthropic: Deepseek và vấn đề kiểm soát xuất khẩu công nghệ

3 xu hướng chính trong phát triển AI:
- Quy luật mở rộng quy mô: Chi phí huấn luyện tăng sẽ cải thiện khả năng nhận thức của AI. Ví dụ: mô hình 1 triệu USD giải được 20% bài toán lập trình, 10 triệu USD giải được 40%
- Đường cong chi phí giảm khoảng 4x mỗi năm nhờ cải tiến về kiến trúc, phần cứng và hiệu quả vận hành
- Chuyển đổi mô hình huấn luyện: Từ 2020-2023 tập trung vào mô hình được huấn luyện trước, 2024 chuyển sang học tăng cường (RL) để tạo chuỗi suy luận

Về DeepSeek:
- DeepSeek-V3 là mô hình được huấn luyện với chi phí 6 triệu USD, đạt hiệu suất gần với các mô hình hàng đầu của Mỹ
- Công ty sở hữu khoảng 50.000 chip Hopper trị giá khoảng 1 tỷ USD
- Mô hình R1 được phát hành sau đó sử dụng học tăng cường, tương tự như mô hình o1 của OpenAI

Về chính sách kiểm soát xuất khẩu:
- Mục tiêu ngăn Trung quốc tiếp cận hàng triệu chip AI vào 2026-2027
- Hạn chế xuất khẩu H100 hoàn toàn, H800 bị cấm từ 10/2023
- DeepSeek vẫn có thể tiếp cận chip thông qua nhiều nguồn khác nhau nhưng khó có thể đạt quy mô hàng triệu chip

📌 DeepSeek không thực sự phá vỡ đường cong chi phí của ngành AI mà chỉ theo xu hướng giảm chi phí tự nhiên. Chính sách kiểm soát xuất khẩu chip vẫn cần thiết để duy trì lợi thế công nghệ của Mỹ, đặc biệt khi ngành AI cần hàng triệu chip trị giá hàng chục tỷ USD vào 2026-2027.

https://darioamodei.com/on-deepseek-and-export-controls

Về DeepSeek và Kiểm Soát Xuất Khẩu

Tháng 01 năm 2025

Vài tuần trước, tôi đã lập luận rằng Mỹ cần thắt chặt hơn nữa các biện pháp kiểm soát xuất khẩu chip sang Trung Quốc. Kể từ đó, DeepSeek—một công ty AI Trung Quốc—đã đạt được hiệu suất gần tương đương với các mô hình AI tiên tiến của Mỹ nhưng với chi phí thấp hơn.

Ở đây, tôi sẽ không tập trung vào việc liệu DeepSeek có thực sự đe dọa các công ty AI Mỹ như Anthropic hay không (dù tôi tin rằng nhiều lo ngại về việc Trung Quốc vượt mặt Mỹ trong AI đang bị phóng đại quá mức【1】). Thay vào đó, tôi muốn bàn về việc liệu những bước tiến của DeepSeek có làm suy yếu lý do áp đặt các biện pháp kiểm soát xuất khẩu chip hay không.

Câu trả lời của tôi là không.

Thực tế, DeepSeek càng phát triển, chính sách kiểm soát xuất khẩu càng trở nên quan trọng hơn.

Kiểm soát xuất khẩu: Giữ vững vị thế của các quốc gia dân chủ trong AI

Kiểm soát xuất khẩu có mục tiêu cốt lõi: giữ các quốc gia dân chủ ở vị trí tiên phong trong phát triển AI.

Hãy rõ ràng: đây không phải là cách để né tránh cạnh tranh giữa Mỹ và Trung Quốc.

Cuối cùng, các công ty AI tại Mỹ và các nền dân chủ khác vẫn cần tạo ra những mô hình tốt hơn Trung Quốc nếu chúng ta muốn dẫn đầu.

Nhưng chúng ta không nên trao cho Đảng Cộng sản Trung Quốc lợi thế công nghệ khi không bắt buộc phải làm vậy.

3 động lực chính trong phát triển AI

Trước khi đi sâu vào lập luận chính sách, tôi muốn giải thích 3 yếu tố cơ bản trong AI mà chúng ta cần hiểu:

1. Định luật Scaling

Một tính chất quan trọng của AI—mà tôi và các đồng nghiệp đã từng nghiên cứu khi còn ở OpenAI—là khi tăng quy mô huấn luyện mô hình AI, hiệu suất sẽ tăng một cách có hệ thống.

Ví dụ:

Một mô hình AI trị giá 1 triệu USD có thể giải được 20% các bài toán lập trình quan trọng.
Một mô hình 10 triệu USD có thể giải được 40%.
Một mô hình 100 triệu USD có thể giải được 60%, và cứ thế tiếp tục.

Những khác biệt này có tác động rất lớn trong thực tế—một mức tăng thêm 10 lần chi phí có thể tương đương với chênh lệch trình độ giữa một sinh viên đại học và một tiến sĩ.

Do đó, các công ty AI đang đầu tư mạnh vào huấn luyện mô hình với quy mô ngày càng lớn.

2. Dịch chuyển đường cong chi phí

Ngành AI liên tục đưa ra những cải tiến lớn và nhỏ giúp tăng hiệu quả hoặc giảm chi phí:

Một thay đổi nhỏ trong kiến trúc mô hình (ví dụ: tinh chỉnh Transformer).
Một cải tiến giúp chạy mô hình hiệu quả hơn trên phần cứng hiện có.
Một thế hệ phần cứng mới có hiệu suất cao hơn.

Những cải tiến này có tác dụng dịch chuyển đường cong hiệu suất:

Nếu một cải tiến mang lại hiệu suất gấp 2 lần (compute multiplier, CM), thì thay vì cần 10 triệu USD để đạt 40%, ta chỉ cần 5 triệu USD.
Hoặc thay vì cần 100 triệu USD để đạt 60%, ta chỉ cần 50 triệu USD.

Mỗi công ty AI hàng đầu đều thường xuyên tìm ra những CM mới:

CM nhỏ (~1.2x) xuất hiện thường xuyên.
CM trung bình (~2x) thỉnh thoảng xuất hiện.
CM lớn (~10x) rất hiếm nhưng có thể thay đổi cuộc chơi.

Vì giá trị của một hệ thống AI thông minh hơn là rất cao, các công ty không giảm ngân sách khi chi phí huấn luyện giảm—họ chỉ đơn giản là huấn luyện các mô hình thông minh hơn, nhanh hơn.

Có một quan niệm sai lầm phổ biến rằng "đầu tiên AI đắt đỏ, sau đó nó trở nên rẻ hơn"—cứ như thể AI là một sản phẩm có chất lượng cố định. Nhưng thực tế không phải như vậy.

Cái quan trọng là đường cong Scaling: khi chi phí huấn luyện giảm, chúng ta không giảm số lượng chip dùng để huấn luyện, mà thay vào đó, chúng ta huấn luyện những mô hình mạnh hơn nhanh hơn.

Năm 2020, tôi và nhóm của mình đã công bố một nghiên cứu cho thấy định luật cải tiến thuật toán đang tăng tốc ở mức ~1.68x/năm.

Tôi tin rằng hiện nay tốc độ này đã tăng lên ít nhất ~4x/năm, đặc biệt khi tính đến cả phần cứng và tối ưu hóa hiệu suất.

3. Cải tiến huấn luyện cũng cải thiện suy luận

Khi đường cong huấn luyện được cải thiện, đường cong suy luận (inference) cũng dịch chuyển theo, giúp giảm mạnh giá thành triển khai AI mà vẫn giữ nguyên chất lượng mô hình.

Ví dụ:

Claude 3.5 Sonnet (ra mắt sau GPT-4 khoảng 15 tháng) vượt trội hơn GPT-4 trên hầu hết các tiêu chí, trong khi giá API chỉ còn 1/10.

Kết luận: Những cải tiến này không làm AI rẻ hơn—chúng chỉ giúp AI mạnh hơn với cùng mức chi phí.

DeepSeek có làm suy yếu lý do kiểm soát xuất khẩu chip không?

Không.

Thực tế, những bước tiến của DeepSeek lại khiến kiểm soát xuất khẩu trở nên quan trọng hơn bao giờ hết.

Tại sao?

Nếu Trung Quốc có thể đạt được hiệu suất AI gần tương đương với Mỹ bằng số chip ít hơn, điều đó không có nghĩa là kiểm soát chip là vô dụng.
Thay vào đó, điều đó có nghĩa là chúng ta phải kiểm soát chip nghiêm ngặt hơn để giữ vững lợi thế công nghệ của Mỹ.
Vì AI đang tăng tốc nhanh hơn dự đoán, việc giới hạn khả năng tính toán của Trung Quốc trở thành yếu tố then chốt để đảm bảo khoảng cách giữa Mỹ và Trung Quốc không bị thu hẹp quá nhanh.

Kiểm soát xuất khẩu không thể ngăn cản Trung Quốc phát triển AI, nhưng có thể làm chậm tốc độ của họ, giúp Mỹ có thêm thời gian củng cố vị thế dẫn đầu.

Nói cách khác: DeepSeek không chứng minh rằng kiểm soát xuất khẩu là vô ích—mà nó chứng minh rằng kiểm soát xuất khẩu là cần thiết hơn bao giờ hết.

Thay đổi mô hình phát triển AI

Thỉnh thoảng, cách mà AI được mở rộng quy mô lại thay đổi, hoặc một phương pháp mở rộng mới được bổ sung vào quá trình huấn luyện.

Từ 2020-2023, phần mở rộng chính là các mô hình tiền huấn luyện (pretrained models)—tức là mô hình được huấn luyện trên lượng dữ liệu internet ngày càng lớn, với một chút tinh chỉnh bổ sung sau đó.
Năm 2024, cách tiếp cận bằng học tăng cường (Reinforcement Learning - RL) để huấn luyện mô hình sinh chuỗi tư duy (chain of thought generation) đã trở thành trọng tâm mới trong mở rộng quy mô AI.

Học tăng cường và bước ngoặt mới trong AI

Các công ty như Anthropic, DeepSeek, và đặc biệt là OpenAI với mô hình o1-preview ra mắt vào tháng 9, đều nhận thấy rằng học tăng cường (RL) có thể cải thiện đáng kể hiệu suất trên một số nhiệm vụ đo lường khách quan như:

Toán học
Các cuộc thi lập trình
Các dạng lập luận phức tạp giống với hai lĩnh vực trên

Mô hình này hoạt động theo hai giai đoạn:

Giai đoạn 1: Huấn luyện mô hình tiền huấn luyện như trước đây.
Giai đoạn 2: Dùng học tăng cường (RL) để cải thiện kỹ năng tư duy.

Điều quan trọng cần hiểu là việc sử dụng RL vẫn còn rất mới.

Hiện tại, chi tiêu cho RL còn nhỏ ở tất cả các công ty.
Chỉ cần tăng từ 100.000 USD lên 1 triệu USD cũng tạo ra mức cải thiện đáng kể.
Các công ty hiện đang chạy đua để mở rộng quy mô giai đoạn 2 lên hàng trăm triệu, thậm chí hàng tỷ USD.

Điều này đưa chúng ta đến một "điểm giao thoa" quan trọng:

Một phương pháp mới, đầy tiềm năng
Chưa được khai thác triệt để
Có thể mang lại những bước nhảy vọt nhanh chóng

Mô hình của DeepSeek

3 yếu tố trên có thể giúp giải thích các bước tiến gần đây của DeepSeek.

Khoảng một tháng trước, DeepSeek ra mắt mô hình "DeepSeek-V3", đây chỉ là mô hình tiền huấn luyện, tức giai đoạn 1 trong quy trình nêu trên.

Tuần trước, họ tiếp tục ra mắt "R1", mô hình có thêm giai đoạn 2 với RL.

Từ bên ngoài, chúng ta không thể biết chính xác mọi thứ về các mô hình này, nhưng dưới đây là những gì tôi hiểu rõ nhất về hai phiên bản của DeepSeek.

DeepSeek-V3: Bước tiến thực sự

Mô hình DeepSeek-V3 thực chất mới là đột phá quan trọng, và đáng lẽ phải được chú ý nhiều hơn ngay từ khi ra mắt.

Với tư cách một mô hình tiền huấn luyện, nó đạt hiệu suất tương đương với các mô hình tiên tiến của Mỹ trên một số tác vụ quan trọng, nhưng chi phí huấn luyện thấp hơn đáng kể.
Tuy nhiên, Claude 3.5 Sonnet của Anthropic vẫn vượt trội hơn đáng kể trong một số tác vụ quan trọng, đặc biệt là lập trình trong môi trường thực tế.

DeepSeek đạt được kết quả này nhờ một số cải tiến kỹ thuật thực sự ấn tượng, chủ yếu tập trung vào tối ưu hóa hiệu suất kỹ thuật:

Cải tiến đặc biệt trong quản lý bộ nhớ đệm Key-Value (Key-Value cache).
Đẩy mạnh phương pháp Mixture of Experts (MoE) hơn so với trước đây.

Nhưng cần nhìn nhận kỹ hơn

1. DeepSeek không phải "làm được với 6 triệu USD những gì Mỹ cần hàng tỷ USD để làm".

Tôi chỉ có thể nói thay cho Anthropic, nhưng:

Claude 3.5 Sonnet là một mô hình có quy mô trung bình, và chi phí huấn luyện chỉ ở mức vài chục triệu USD (tôi không thể tiết lộ con số chính xác).
Sonnet không được huấn luyện bằng một mô hình lớn hơn hay đắt tiền hơn, trái với một số tin đồn.
Claude 3.5 Sonnet đã được huấn luyện từ 9-12 tháng trước, trong khi DeepSeek-V3 được huấn luyện vào tháng 11/12 năm 2024.
Sonnet vẫn vượt trội hơn DeepSeek-V3 trên nhiều bài đánh giá nội bộ và bên ngoài.

Vì vậy, một tuyên bố công bằng hơn là:

DeepSeek đã tạo ra một mô hình gần với các mô hình của Mỹ ra mắt trước đó 7-10 tháng, với chi phí thấp hơn đáng kể (nhưng không đến mức tỷ lệ mà nhiều người đã suy đoán).

DeepSeek-V3 không phải là một đột phá mang tính cách mạng

Xu hướng giảm chi phí AI vẫn đang diễn ra như thường lệ

Nếu chi phí huấn luyện AI theo định luật giảm chi phí (cost curve decrease) giảm ~4 lần mỗi năm, thì theo xu hướng lịch sử (giống như năm 2023 và 2024), ta có thể dự đoán rằng:

Một mô hình có chi phí rẻ hơn 3-4 lần so với Claude 3.5 Sonnet hoặc GPT-4o ở thời điểm hiện tại là điều hoàn toàn bình thường.
Nếu DeepSeek-V3 kém hơn khoảng 2 lần trên đường cong Scaling so với các mô hình AI tiên tiến nhất của Mỹ (một đánh giá có phần ưu ái DeepSeek-V3), thì theo quy luật, chi phí huấn luyện của nó có thể thấp hơn khoảng 8 lần so với các mô hình Mỹ ra mắt một năm trước.

Điều này có nghĩa là:

Ngay cả khi chấp nhận con số chi phí huấn luyện của DeepSeek, thì mô hình này chỉ đơn thuần là một điểm trên xu hướng giảm chi phí đang diễn ra, chứ không phải một bước đột phá làm thay đổi toàn bộ kinh tế học của LLMs (mô hình ngôn ngữ lớn).
Trên thực tế, DeepSeek-V3 còn có mức giảm chi phí thấp hơn cả khoảng cách giữa GPT-4 và Claude 3.5 Sonnet trong chi phí suy luận (Claude 3.5 Sonnet rẻ hơn GPT-4 tới 10 lần, đồng thời vẫn tốt hơn GPT-4 về hiệu suất).

Điểm khác biệt duy nhất lần này là:

Công ty đầu tiên chứng minh xu hướng giảm chi phí lại là một công ty Trung Quốc.

Đây là một sự kiện quan trọng về mặt địa chính trị, nhưng không phải là một đột phá kỹ thuật chưa từng có.

Các công ty AI Mỹ cũng đang đạt được mức giảm chi phí tương tự

Các công ty AI của Mỹ không cần phải sao chép DeepSeek để đạt được mức chi phí thấp hơn—họ cũng đang tiến theo quy luật giảm chi phí thông thường của ngành AI.

Cả DeepSeek và các công ty AI Mỹ đều đang sở hữu nhiều tiền và nhiều GPU hơn bao giờ hết.
Những GPU này không chỉ dùng để huấn luyện một mô hình duy nhất, mà còn phục vụ R&D để phát triển ý tưởng đằng sau mô hình, hoặc đào tạo các mô hình lớn hơn chưa sẵn sàng ra mắt.

Theo một số báo cáo (chưa thể xác nhận hoàn toàn), DeepSeek hiện có 50.000 GPU Hopper.

Đây là chỉ bằng 1/2 hoặc 1/3 số GPU mà các công ty AI Mỹ lớn nhất đang có (ví dụ, cụm "Colossus" của xAI có gấp 2-3 lần con số này【7】).
Chỉ riêng 50.000 GPU Hopper này đã có giá trị khoảng 1 tỷ USD.

Như vậy, tổng chi tiêu của DeepSeek với tư cách một công ty (không chỉ riêng chi phí huấn luyện mô hình) không chênh lệch quá nhiều so với các phòng thí nghiệm AI lớn của Mỹ.

Mô hình DeepSeek-R1 không có đột phá kỹ thuật đáng kể

DeepSeek-R1 là mô hình được ra mắt tuần trước và đã tạo ra làn sóng chú ý lớn, gây giảm 17% giá cổ phiếu của Nvidia.

Tuy nhiên, từ góc độ đổi mới và kỹ thuật, R1 kém thú vị hơn nhiều so với V3.

V3 là bước đột phá thực sự về tối ưu hóa kỹ thuật.
R1 chỉ đơn giản là thêm giai đoạn thứ hai—học tăng cường (RL), tức là sao chép cách tiếp cận mà OpenAI đã làm với o1.
R1 và o1 dường như có quy mô và kết quả tương tự nhau【8】.

Nhưng vì chúng ta đang ở giai đoạn đầu của đường cong Scaling, nhiều công ty có thể tạo ra các mô hình AI suy luận tốt bằng cách áp dụng RL lên một mô hình tiền huấn luyện mạnh.

Việc tạo ra R1 dựa trên V3 có thể là một quá trình rất rẻ.
Hiện tại, nhiều công ty có thể tạo ra mô hình tư duy chuỗi (chain-of-thought reasoning) tốt như R1.

Tuy nhiên, điều này sẽ không kéo dài lâu.

Khi các công ty tiến xa hơn trên đường cong Scaling của các mô hình AI suy luận, khoảng cách giữa những người đi đầu và phần còn lại sẽ gia tăng trở lại.

Tổng kết

DeepSeek-V3 không phải là một đột phá làm thay đổi toàn bộ ngành AI, mà chỉ là một điểm trên xu hướng giảm chi phí đang diễn ra.
Điểm khác biệt duy nhất là lần đầu tiên, một công ty Trung Quốc đạt được xu hướng giảm chi phí trước Mỹ—đây là một vấn đề địa chính trị, không phải vấn đề kỹ thuật.
Các công ty AI Mỹ cũng sẽ nhanh chóng giảm chi phí theo xu hướng tương tự, không cần sao chép DeepSeek.
DeepSeek có khoảng 50.000 GPU Hopper (trị giá khoảng 1 tỷ USD), không chênh lệch quá lớn so với các công ty AI Mỹ.
DeepSeek-R1 không có cải tiến kỹ thuật đáng kể, chỉ là một bước triển khai RL giống như OpenAI đã làm với o1.
Chúng ta đang ở một "điểm giao thoa" (crossover point), nơi nhiều công ty có thể tạo ra các mô hình suy luận mạnh. Tuy nhiên, điều này sẽ không kéo dài lâu.

Kiểm Soát Xuất Khẩu: Quyết Định Một Thế Giới Đơn Cực hay Hai Cực

Cuộc đua AI và chi phí không ngừng tăng

Các công ty AI đang chi tiêu ngày càng nhiều để huấn luyện những mô hình mạnh hơn, ngay cả khi chi phí huấn luyện giảm theo xu hướng định kỳ.

Tại sao?

Giá trị kinh tế của các mô hình AI thông minh hơn là quá lớn, đến mức bất kỳ khoản tiết kiệm nào cũng ngay lập tức được tái đầu tư để tạo ra mô hình thông minh hơn với chi phí khổng lồ như ban đầu.
Những cải tiến về hiệu suất mà DeepSeek đạt được (và chưa được các phòng thí nghiệm Mỹ áp dụng) sẽ sớm được các công ty Mỹ và Trung Quốc tích hợp để huấn luyện các mô hình AI trị giá hàng tỷ USD.
Các mô hình mới này sẽ mạnh hơn đáng kể, nhưng chi phí huấn luyện vẫn tiếp tục tăng—cho đến khi chúng ta đạt đến AI thông minh hơn gần như tất cả con người trong hầu hết các lĩnh vực.

Mốc thời gian?

AI thông minh hơn con người trong gần như mọi lĩnh vực sẽ cần hàng triệu GPU, hàng chục tỷ USD.
Dự kiến điều này sẽ xảy ra vào khoảng năm 2026-2027.

DeepSeek không làm thay đổi thực tế này—họ đơn giản chỉ là một điểm dữ liệu trên đường cong chi phí đã được tính toán từ trước.

2026-2027: Thế giới sẽ đơn cực hay hai cực?

Vào năm 2026-2027, chúng ta có thể đối mặt với hai kịch bản hoàn toàn khác nhau.

Kịch bản 1: Thế giới hai cực (Mỹ - Trung cân bằng AI)

Mỹ chắc chắn sẽ có hàng triệu GPU và đủ tài chính (từ 10-100 tỷ USD) để huấn luyện AI mạnh nhất.
Câu hỏi là liệu Trung Quốc có thể sở hữu số lượng GPU tương tự hay không.

Nếu Trung Quốc có thể đạt được số lượng GPU này:

Chúng ta sẽ có một thế giới hai cực (bipolar world), nơi cả Mỹ và Trung Quốc đều có các mô hình AI mạnh mẽ, tạo ra tiến bộ khoa học và công nghệ vượt bậc.
Nhưng cân bằng này không nhất thiết sẽ tồn tại lâu dài:
- Trung Quốc có thể huy động tài năng, vốn và nguồn lực quân sự nhiều hơn Mỹ.
- Kết hợp với nền công nghiệp khổng lồ và lợi thế chiến lược quân sự, Trung Quốc có thể vượt lên dẫn trước không chỉ trong AI mà còn trong toàn bộ cuộc chơi công nghệ toàn cầu.

Kịch bản 2: Thế giới đơn cực (Mỹ thống trị AI)

Nếu Trung Quốc không thể tiếp cận hàng triệu GPU, chúng ta sẽ có một thế giới đơn cực (unipolar world)—nơi chỉ Mỹ và các đồng minh sở hữu AI mạnh nhất.

Thế giới đơn cực có thể không kéo dài mãi mãi, nhưng nó có thể mang lại lợi thế lâu dài cho Mỹ.
Lý do: AI có thể giúp tạo ra những AI còn thông minh hơn—nghĩa là nếu Mỹ dẫn trước trong ngắn hạn, họ có thể duy trì khoảng cách này mãi mãi【10】.
Trong kịch bản này, Mỹ và các đồng minh có thể giành vị thế thống trị toàn cầu trong nhiều thập kỷ.

Yếu tố quyết định: Kiểm soát xuất khẩu

Biện pháp kiểm soát xuất khẩu là yếu tố quan trọng nhất quyết định liệu thế giới sẽ đơn cực hay hai cực.

Nếu kiểm soát xuất khẩu được thực thi nghiêm ngặt, Trung Quốc sẽ không thể sở hữu hàng triệu GPU.
Điều này làm tăng khả năng Mỹ dẫn trước lâu dài.

Kiểm soát xuất khẩu có thất bại không?

DeepSeek không chứng minh rằng các biện pháp kiểm soát xuất khẩu đã thất bại.

DeepSeek có một lượng GPU đáng kể, nhưng không vượt xa đáng kể so với các công ty AI Mỹ.
Các biện pháp kiểm soát không nhằm ngăn chặn Trung Quốc sở hữu vài chục nghìn GPU, mà là để ngăn chặn họ sở hữu hàng triệu GPU.

Trung Quốc có thể buôn lậu một số lượng GPU nhỏ, nhưng:

Không thể giấu được 10 tỷ hay 100 tỷ USD hàng hóa.
Một triệu GPU là gần như không thể buôn lậu, cả về mặt tài chính lẫn hậu cần.

DeepSeek và lỗ hổng kiểm soát xuất khẩu

Theo SemiAnalysis, DeepSeek hiện sở hữu khoảng 50.000 GPU, bao gồm:

H100: Bị cấm từ khi ra mắt, nếu DeepSeek có chúng, chắc chắn chúng đã bị buôn lậu.
H800: Được phép nhập khẩu trước tháng 10/2023, sau đó bị cấm khi chính sách kiểm soát được cập nhật.
H20: Chưa bị cấm, nhưng thực tế phù hợp hơn cho suy luận (inference) hơn là huấn luyện (training).

Những gì DeepSeek sở hữu cho thấy kiểm soát xuất khẩu đang phát huy tác dụng:

Nếu Mỹ không cập nhật lệnh cấm năm 2023, DeepSeek có thể đã có một lượng lớn H100 hoặc H800.
Việc Trung Quốc không có một hệ thống toàn bộ H100 chứng tỏ lỗ hổng kiểm soát đang dần được khắc phục.
Nếu Mỹ tiếp tục siết chặt kiểm soát, họ có thể ngăn chặn Trung Quốc đạt đến ngưỡng hàng triệu GPU.

DeepSeek không phải đối thủ, nhưng chính phủ Trung Quốc thì có

DeepSeek không phải là kẻ thù của Mỹ.

Nhóm nghiên cứu của DeepSeek bao gồm các kỹ sư tài năng và đam mê công nghệ.
Họ chỉ đơn thuần muốn tạo ra công nghệ hữu ích.

Nhưng họ hoạt động dưới sự kiểm soát của một chính phủ độc tài, chính phủ này:

Vi phạm nhân quyền.
Hành xử hung hăng trên trường quốc tế.
Sẽ còn táo bạo hơn nữa nếu họ đạt được vị thế ngang bằng với Mỹ trong AI.

Xu hướng AI ngày càng mạnh hơn không phải là lý do để dỡ bỏ kiểm soát xuất khẩu

Một số người cho rằng AI càng mạnh thì càng khó kiểm soát, nên Mỹ không cần kiểm soát xuất khẩu nữa.
Lập luận này là vô lý.

Chính vì công nghệ AI ngày càng mạnh, việc kiểm soát xuất khẩu càng trở nên quan trọng hơn bao giờ hết.

Mỹ không thể để Trung Quốc có đủ GPU để xây dựng một AI ngang hàng với Mỹ.

Nếu kiểm soát xuất khẩu được thực thi đúng cách, Mỹ có thể duy trì vị thế AI số một thế giới trong nhiều thập kỷ tới.

Không có file đính kèm.

Nguồn tham khảo

103

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-02-09 23:30:59

Pháp thu hút khoản đầu tư khổng lồ 20 tỷ euro từ Canada cho trung tâm dữ liệu AI

- Quỹ Brookfield của Canada sẽ đầu tư 20 tỷ euro (tương đương 21 tỷ USD) đến năm 2030 để xây dựng các trung tâm dữ liệu AI tại Pháp

- Thông báo được đưa ra trước thềm hội nghị thượng đỉnh AI toàn cầu tại Paris vào ngày 12-13/02/2025

- Trong tổng số 20 tỷ euro:
- 15 tỷ euro dành cho xây dựng trung tâm mới
- 5 tỷ euro đầu tư vào cơ sở hạ tầng liên quan, đặc biệt là các nhà máy điện

- Dự án trọng điểm sẽ được xây dựng tại thành phố Cambrai ở phía bắc Pháp

- Thỏa thuận được ký kết ngày 31/01/2025 giữa tổng thống Pháp Emmanuel Macron và CEO Brookfield Bruce Flatt

- Các Tiểu vương quốc Ả rập thống nhất (UAE) cũng đã công bố kế hoạch xây dựng trung tâm dữ liệu lớn nhất châu Âu tại Pháp với tổng đầu tư từ 30-50 tỷ euro

Hiện trạng trung tâm dữ liệu tại Pháp:
- Có hơn 300 trung tâm
- Xếp hạng thứ 6 thế giới
- Các nước dẫn đầu: Mỹ, Đức, Anh, Trung Quốc và Canada

- Mỹ gần đây đã công bố kế hoạch đầu tư 500 tỷ USD vào cơ sở hạ tầng AI do OpenAI và SoftBank dẫn đầu

📌 Pháp đang trở thành điểm đến hấp dẫn cho đầu tư AI với 2 thương vụ lớn từ Brookfield (20 tỷ euro) và UAE (30-50 tỷ euro). Với hơn 300 trung tâm dữ liệu hiện có, quốc gia này đang khẳng định vị thế trong cuộc đua công nghệ AI toàn cầu.

https://www.france24.com/en/business/20250209-paris-ai-summit-canadian-fund-brookfield-to-invest-%E2%82%AC20-billion-in-france

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-02-07 22:43:54

Masayoshi Son của SoftBank và Sam Altman của OpenAI đặt cược vào AI—và vào nhau

- Masayoshi Son và Sam Altman lần đầu gặp nhau năm 2017 tại Tokyo, khi đó Altman chưa có dự án đủ lớn để thu hút đầu tư từ SoftBank

- Son từng cố gắng đầu tư gần 1 tỷ USD vào OpenAI nhưng bị Altman từ chối, thay vào đó OpenAI chọn Microsoft làm đối tác chiến lược

- SoftBank hiện đang dẫn đầu vòng đầu tư kỷ lục 40 tỷ USD vào OpenAI với mức định giá trước đầu tư là 260 tỷ USD

- Dự án Stargate - trung tâm dữ liệu AI trị giá 500 tỷ USD đang được hai bên phát triển:
+ SoftBank cam kết đầu tư 15-20 tỷ USD
+ OpenAI sẽ đầu tư một khoản tương đương
+ MGX (quỹ đầu tư nhà nước Abu Dhabi) cũng tham gia góp vốn

- Son có tiền lệ đặt cược lớn vào các doanh nhân trẻ:
+ Thành công với khoản đầu tư 20 triệu USD vào Alibaba của Jack Ma
+ Thất bại với khoản lỗ 14,2 tỷ USD từ WeWork của Adam Neumann

- Thỏa thuận được thảo luận nhanh chóng trong vài tháng qua, chủ yếu giữa Son và Altman, với sự tham gia của đội ngũ điều hành chủ chốt từ hai bên

- OpenAI chưa ký hợp đồng đảm bảo sử dụng Stargate, dù dự án được thiết kế riêng cho công ty

📌 Masayoshi Son và Sam Altman thiết lập quan hệ đối tác chiến lược với tổng giá trị đầu tư lên tới 540 tỷ USD, bao gồm 40 tỷ USD vào OpenAI và 500 tỷ USD cho dự án Stargate, đánh dấu thương vụ lớn nhất trong lịch sử công nghệ AI.

https://www.ft.com/content/fc57feea-db72-4e86-b3ce-8956b3d739e3

#FT

Masayoshi Son của SoftBank và Sam Altman của OpenAI đặt cược vào AI—và vào nhau
Hai tỷ phú dẫn đầu cuộc đàm phán về thỏa thuận kỷ lục, biến nhà đầu tư Nhật Bản thành cổ đông lớn nhất của nhà phát triển ChatGPT

Khi Masayoshi Son và Sam Altman lần đầu gặp nhau vào năm 2017 tại trụ sở SoftBank ở Tokyo, vị doanh nhân trẻ chưa có dự án nào đủ lớn để khiến tỷ phú công nghệ rút séc đầu tư.

Trong hai năm tiếp theo, khi OpenAI của Altman phát triển thành một trong những công ty trí tuệ nhân tạo (AI) mạnh nhất thế giới, Son đã cố gắng đầu tư gần 1 tỷ USD vào nhà phát triển ChatGPT.

Altman từ chối.

Thay vào đó, ông chọn Microsoft, công ty có thể cung cấp sức mạnh tính toán cần thiết để thúc đẩy sự tăng trưởng của OpenAI, theo một người trực tiếp biết về quyết định này.

Kể từ đó, OpenAI của Altman đã trở thành một trong những startup phát triển nhanh nhất mọi thời đại và đang tìm cách mở rộng vượt ra khỏi quan hệ hợp tác với Microsoft. Điều này tạo cơ hội cho SoftBank dẫn đầu khoản đầu tư vào startup lớn nhất từ trước đến nay—một vòng huy động 40 tỷ USD vào OpenAI. Đổi lại, Son có được điều ông khao khát: một vị trí trung tâm trong thế giới AI.

Trên sân khấu ở Tokyo tuần này, hai người đã thảo luận về một kế hoạch liên quan: dự án trung tâm dữ liệu AI trị giá 500 tỷ USD có tên “Stargate”. Son, dù chưa đầy 70 tuổi, vẫn tận hưởng vai trò một người dẫn dắt đầy nhiệt huyết, ngồi đối diện với Altman, người trẻ hơn gần 30 tuổi và có vẻ kém thoải mái hơn trước đám đông.

Dù khác biệt, cả hai đều tin tưởng rằng kỷ nguyên trí tuệ nhân tạo tổng quát (AGI)—khi máy móc có thể vượt trội con người trong các lĩnh vực nhận thức—đang đến gần, và một siêu trí tuệ mạnh hơn theo cấp số nhân sẽ xuất hiện sau đó.

“Khi tôi gặp cậu lúc còn trẻ... cậu nói rằng sẽ theo đuổi AGI và tôi lập tức nói, ‘Tôi tin cậu. Tôi muốn đầu tư,’” Son nói với Altman tại Tokyo. “Từ đó tôi đã là một người tin tưởng. Tôi chưa bao giờ nghi ngờ. Lúc đó hầu hết mọi người nghĩ cậu điên, đúng không?”

“Một số người cũng nghĩ ông điên. Cuối cùng thì mọi thứ cũng đâu vào đó,” Altman đáp lại.

Thỏa thuận mà Son và Altman đang thiết lập có quy mô và cấu trúc chưa từng có, với các cuộc đàm phán giữa SoftBank và OpenAI diễn ra theo hai giai đoạn, theo những người biết về kế hoạch này.

Đầu tiên, là một vòng huy động vốn độc quyền, trong đó SoftBank cam kết đầu tư tới 40 tỷ USD vào OpenAI. SoftBank không nhất thiết phải cung cấp toàn bộ số tiền mà có quyền mời các đối tác khác tham gia vòng gọi vốn. OpenAI có quyền chấp thuận hoặc từ chối các nhà đầu tư mới, theo một người trực tiếp biết về kế hoạch này.

Vòng gọi vốn dự kiến định giá OpenAI ở mức 260 tỷ USD trước đầu tư mới. “Đây là vòng gọi vốn của Masa, nhưng Masa sẽ được phép đưa một số nhà đầu tư khác vào OpenAI với giới hạn nhất định,” một người tham gia đàm phán cho biết.

Trong giai đoạn thứ hai, SoftBank dự kiến ban đầu rót khoảng 15 tỷ-20 tỷ USD vào Stargate. OpenAI, với nguồn vốn mới từ vòng đầu tư của SoftBank, đã đồng ý đầu tư số tiền tương đương với con số mà tập đoàn Nhật Bản rót vào dự án hạ tầng này.

Các đối tác, bao gồm MGX, quỹ thuộc sở hữu nhà nước Abu Dhabi và một nhà đầu tư cổ phần của Stargate, có kế hoạch đưa ra các quyết định đầu tư tiếp theo khi thấy tiến triển của dự án, theo 3 người quen thuộc với kế hoạch này.

OpenAI và SoftBank từ chối bình luận.

Thỏa thuận này phù hợp với phong cách đầu tư của Son—liều lĩnh đặt niềm tin, hậu thuẫn bằng hàng tỷ USD, và thường bỏ qua khuyến nghị từ các cố vấn cấp dưới.

Một khoản đầu tư sớm trị giá 20 triệu USD vào Jack Ma chỉ một năm sau khi Alibaba thành lập đã giúp Son kiếm được hàng tỷ USD và củng cố danh tiếng như một nhà đầu tư ngôi sao.

Nhưng cuộc tìm kiếm "cơ hội lớn tiếp theo" của ông cũng dẫn đến nhiều khoản lỗ nghiêm trọng, bao gồm 14,2 tỷ USD khi đặt cược vào Adam Neumann, khi WeWork lao vào phá sản. Theo một người biết về quyết định đó, có thời điểm, chính một số nhà đầu tư của Son đã phải ngăn ông rót thêm hàng tỷ USD vào công ty của Neumann.

"Điểm yếu chí mạng của Masa là ông ấy dễ bị cuốn hút bởi những chàng trai trẻ có tầm nhìn," một người từng làm việc chặt chẽ với ông nhận xét.

Kế hoạch cho Stargate được vạch ra trong vài tháng gần đây, chủ yếu do Son và Altman tự bàn bạc mà không có cố vấn bên cạnh, theo những người quen thuộc với quá trình này.

“3 tháng trước, Sam vẫn còn 'hẹn hò'… nhưng trong vài tháng qua, anh ấy đã quyết định cam kết với Masa,” một người thân cận với SoftBank cho biết.

Một số cố vấn của Son đang cố gắng kiềm chế ông, lo ngại rằng Altman có những động cơ riêng—bao gồm việc mở rộng quan hệ hợp tác vượt ra khỏi nhà đầu tư lớn nhất hiện tại của OpenAI là Microsoft.

“[Sam] không còn điều hành một startup nữa. Đây là một công ty lớn với tham vọng lớn. Vậy thì cứ để họ làm,” một người quen thuộc với quan điểm của Microsoft nhận xét.

Ngoài 2 nhân vật chính, một đội ngũ điều hành chủ chốt cũng được giao nhiệm vụ xử lý các chi tiết của thỏa thuận. Đội ngũ này bao gồm Sarah Friar, giám đốc tài chính của OpenAI, Peter Hoeschele, phụ trách xây dựng cơ sở hạ tầng tại OpenAI, Rene Haas, CEO của Arm, và Vikas Parekh, một giám đốc điều hành từ SoftBank.

Stargate được thiết kế chỉ dành riêng cho OpenAI, dựa trên giả định rằng nhu cầu tính toán của công ty AI có trụ sở tại San Francisco sẽ tiếp tục tăng vọt. Tuy nhiên, theo một người trực tiếp biết về liên doanh này, OpenAI chưa ký hợp đồng đảm bảo sẽ sử dụng cơ sở hạ tầng đó.

“Thỏa thuận Stargate không phải là một hợp đồng tiêu chuẩn... [Son] phải xây dựng với niềm tin và hiểu rằng OpenAI sẽ muốn sử dụng năng lực tính toán này. Nhưng chưa có hợp đồng ràng buộc,” người này cho biết.

OpenAI dự kiến sẽ ký kết các thỏa thuận để sử dụng bất kỳ cơ sở nào mà Stargate phát triển hoặc đầu tư vào, và về lâu dài có thể mở dự án này cho các khách hàng khác, theo một người thân cận với công ty. Một người khác hiểu về chiến lược của SoftBank cho biết họ sẽ không bắt đầu xây dựng trung tâm dữ liệu nếu chưa có hợp đồng cam kết từ OpenAI.

Trong một báo cáo năm ngoái, OpenAI lập luận rằng “hạ tầng chính là định mệnh,” và Altman tỏ ra lạc quan về khả năng đánh bại các đối thủ trong cuộc đua đến AGI nếu có đủ nguồn lực.

Tuy nhiên, các mô hình AI mới, hiệu quả hơn đang xuất hiện, chẳng hạn như R1 của công ty AI Trung Quốc DeepSeek, đặt ra thách thức đối với giả định rằng quy mô lớn luôn mang lại lợi thế.

Bất kỳ sự chững lại nào trong nhu cầu đối với các trung tâm dữ liệu khổng lồ sẽ gây ra vấn đề nghiêm trọng cho Stargate. “Nếu OpenAI không thúc đẩy nhu cầu, bạn sẽ thấy điều từng xảy ra với ngành bán dẫn: các nhà máy sản xuất chip trống rỗng,” một nhà đầu tư từng làm việc với Son nhận xét. “Tình hình sẽ rất tệ, rất khốc liệt.”

Thỏa thuận độc đáo này gắn chặt Son với Altman, khiến tương lai của SoftBank phụ thuộc vào khả năng của OpenAI trong việc tiếp tục tăng trưởng cả về định giá lẫn nhu cầu trung tâm dữ liệu. Hai bên cũng đã thành lập một liên doanh tại Nhật Bản để bán các sản phẩm của OpenAI, trong khi các công ty thuộc tập đoàn SoftBank cam kết chi thêm 3 tỷ USD mỗi năm để sử dụng dịch vụ của OpenAI.

“Hiện tại, cái gì tốt cho Sam cũng tốt cho Masa,” một người quen thuộc với cả hai cho biết, đồng thời lưu ý rằng kế hoạch của Son không chỉ dừng lại ở OpenAI, mà còn bao gồm việc lấn sân sang sản xuất chip.

Những người này cũng lập luận rằng không phải mọi quyết định lớn của Son đều dựa trên niềm tin vào cá nhân, nhấn mạnh thương vụ thâu tóm Arm. Nhà thiết kế chip của Anh—niêm yết vào năm ngoái và vẫn thuộc sở hữu gần 90% của SoftBank—đã mang lại cho Son khả năng tiếp cận hàng tỷ USD thông qua quỹ đầu tư và các khoản vay thế chấp, cũng như một vị trí cốt lõi trong ngành AI.

“Mọi quỹ đầu cơ, doanh nhân và nhà công nghệ đều đang tự hỏi ‘làm thế nào để cạnh tranh với Sam Altman?’” một nhà đầu tư lớn nhận xét. “Với tiền của Masa, liệu ông ấy có thể tạo ra một lợi thế không thể bị đánh bại?”

SoftBank’s Masayoshi Son and OpenAI’s Sam Altman bet on AI — and each other
The two billionaires lead talks over record deal to make Japanese investor biggest backer of ChatGPT maker

When Masayoshi Son and Sam Altman first met each other in 2017 at SoftBank’s offices in Tokyo, the younger entrepreneur lacked a project large enough to tempt the tech billionaire to get his cheque book out.
Over the next two years, as Altman’s OpenAI evolved into one of the world’s most potent artificial intelligence companies, Son tried to invest close to $1bn in the ChatGPT maker.
Altman refused.
He instead opted for Microsoft, which could provide the computing power needed to turbocharge his company’s growth, according to a person with direct knowledge of the decision.
Altman’s OpenAI has since become one of the fastest-growing start-ups of all time and is straining to grow beyond its partnership with Microsoft. That has cleared a path for SoftBank to lead the largest-ever start-up investment — a $40bn round into OpenAI. In return, Son gets something he craves: a place at the centre of the AI world.
On stage in Tokyo this week, the two men discussed a connected plan: a $500bn AI data centre project dubbed “Stargate”. Son, a few years shy of 70, still revelling in his abilities as a showman, sat across from Altman, nearly 30 years his junior and a man who seemed less at ease in front of a crowd.
For all their differences, they share a conviction that the era of artificial general intelligence — when machines can outperform humans across cognitive fields — is at hand, and that exponentially more powerful superintelligence will follow.
“When I met you when you were younger . . . you said that you’re going to go for AGI and I immediately said, ‘I believe you. I want to invest,’” Son told Altman in Tokyo. “From there I was a believer. I never doubted. Most people at that time thought you were crazy, right?”
“Some people think you’re crazy too. It all works out,” Altman replied.

The deal Son and Altman are putting together is unprecedented in size and structure, with talks between SoftBank and OpenAI playing out over two stages, according to people with knowledge of the plans.
First, there is an exclusive funding round in which SoftBank has committed to invest up to $40bn in OpenAI. SoftBank is not expected to provide the full amount on its own and has the right to bring other partners into the funding round. OpenAI can approve or veto the new investors, according to a person with direct knowledge of the plans.
The funding round is expected to value OpenAI at a pre-money valuation of $260bn. “It’s Masa’s round, but Masa will be allowed to bring other investors into OpenAI on a limited basis,” said one person involved in the talks.
In the second phase, SoftBank is planning to initially put about $15bn-$20bn into Stargate. OpenAI, with new money from the SoftBank round, has agreed to match whatever figure the Japanese group puts into the infrastructure project.
Partners including MGX, the Abu Dhabi state-owned fund and a Stargate equity investor, intend to make further investment decisions once they see progress on the project, according to three people with knowledge of the plans.

OpenAI and SoftBank declined to comment.
The deal fits Son’s record of taking leaps of faith, backed by billions in capital, often overriding the recommendations of his lieutenants.
An early $20mn bet on Jack Ma just a year after Alibaba was founded made Son billions and forged his reputation as a star investor.

His search for the next big thing has also resulted in numerous dramatic losses, including $14.2bn on Adam Neumann as WeWork tumbled into bankruptcy. At one point, some of Son’s own backers had to veto his attempts to invest billions more into Neumann’s company, according to a person with knowledge of that decision.
“The Achilles heel of Masa is he just falls in love with these visionary young men,” said one person who has worked closely with him.
The plan for Stargate was put together rapidly over the past few months, often with just Son and Altman thrashing out the details without advisers present, said people familiar with the process.
“Until three months ago, Sam was dating . . . but in the past few months he’s decided he will commit to Masa,” said one of the people close to SoftBank.
Some of Son’s advisers are trying to rein him in again, mindful that Altman has his own motivations — including trying to extend its partnerships beyond its current biggest backer, Microsoft.
“[Sam] is no longer running a start-up. It’s a big company with big ambitions. So all power to them,” said a person familiar with Microsoft’s thinking.
As well as the two main characters, a core executive team was tasked with working out the details. It included Sarah Friar, OpenAI chief financial officer, Peter Hoeschele, in charge of infrastructure buildout at OpenAI, Rene Haas, Arm CEO and Vikas Parekh, an executive from SoftBank.
Stargate is designed solely for the use of OpenAI, based on the assumption that the San Francisco-based group’s demand for computing power will continue to skyrocket. But, according to one person with direct knowledge of the joint venture, OpenAI has not signed a contract guaranteeing its usage.
“The Stargate deal is not a standard deal . . . [Son] has to build this with the belief and understanding that OpenAI will want to take the compute. But there’s no contract,” they said.
OpenAI expects to sign agreements to make use of any sites that Stargate develops or invests in, and could ultimately open the project to other customers, according to a person close to the company. Another person familiar with SoftBank’s thinking said they would not start building data centres without such a contract in place.
OpenAI argued in a paper last year that “infrastructure is destiny” and Altman has been bullish about the company’s ability to beat rivals to AGI given enough resources.

But new, more efficient AI models are emerging, such as Chinese AI company DeepSeek’s R1, which have challenged assumptions about the advantages of scale.
Any slowing of demand for massive data centres would pose a significant problem for Stargate. “If you don’t have OpenAI driving demand, you will have what you had in the semiconductor cycle: empty fabs [semiconductor fabrication plants],” said the investor who has worked with Son. “It will get very bloody, very ugly.”
The novel arrangement anchors Son to Altman, tying SoftBank’s fate to OpenAI’s ability to continue growing both its valuation and its demand for data centres. The two groups have also put together a joint venture in Japan to sell OpenAI products and SoftBank group companies have committed to spending another $3bn a year on OpenAI services.
“At the moment, what’s good for Sam is good for Masa,” said a person familiar with the pair, noting that Son’s plans remain bigger than OpenAI, including moving into chip production.
The same people also argue that not all of Son’s biggest moves are due to a belief in individuals, highlighting the bet to acquire Arm. The UK chip designer — which was listed last year and in which SoftBank still owns close to 90 per cent — has given Son the potential to access billions in funds and collateralised loans, as well as a core piece of the AI sector.
“Every hedge fund, entrepreneur and technologist is thinking ‘how do I chip away at Sam Altman?’’’ said one major investor. “With Masa’s money can he create an unassailable lead?”

Không có file đính kèm.

Nguồn tham khảo

Semi-Cloud-DC-Green AI chips-hardware-compute 2025-02-07 22:03:58

Pháp và UAE ký thỏa thuận phát triển trung tâm dữ liệu AI 1 gigawatt trị giá 30-50 tỷ USD

- Pháp và UAE đã ký kết thỏa thuận khung để phát triển trung tâm dữ liệu AI công suất 1 gigawatt, với tổng mức đầu tư từ 30-50 tỷ USD

- Tổng thống Pháp Emmanuel Macron đã tiếp đón người đồng cấp UAE Sheikh Mohamed bin Zayed al-Nahyan tại Paris ngày 6/2/2025

- Thỏa thuận được ký kết trước thềm hội nghị thượng đỉnh AI tại Paris (diễn ra ngày 10-11/2/2025) với sự tham gia của khoảng 100 quốc gia

- Hai nhà lãnh đạo cam kết thiết lập quan hệ đối tác chiến lược trong lĩnh vực AI, tập trung vào:
+ Phát triển chuỗi giá trị AI
+ Mua sắm chip công nghệ cao
+ Xây dựng trung tâm dữ liệu
+ Phát triển nhân tài
+ Thành lập đại sứ quán dữ liệu ảo

- Dự án nhằm giúp Pháp và châu Âu cạnh tranh với Mỹ và Trung Quốc trong lĩnh vực AI

- Chính phủ Pháp đã xác định 35 địa điểm để xây dựng trung tâm dữ liệu AI

- Chi tiết về các khoản đầu tư đầu tiên sẽ được công bố tại hội nghị Choose France trong năm nay

📌 Thỏa thuận hợp tác Pháp-UAE trị giá lên đến 50 tỷ USD đánh dấu bước đột phá trong việc phát triển cơ sở hạ tầng AI tại châu Âu. Dự án trung tâm dữ liệu 1 gigawatt sẽ tạo nền tảng quan trọng giúp Pháp cạnh tranh với các cường quốc AI như Mỹ và Trung Quốc.

https://www.reuters.com/technology/artificial-intelligence/france-uae-agree-develop-1-gigawatt-ai-data-centre-2025-02-06/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-02-05 23:18:00

Hướng dẫn chi tiết về yêu cầu phần cứng cho các mô hình AI DeepSeek R1

- DeepSeek R1 là mô hình AI do đội ngũ phát triển Trung quốc tạo ra, có khả năng mở rộng từ 1,5 tỷ đến 671 tỷ tham số

- Yêu cầu cho mô hình nhỏ (1,5 tỷ tham số):
+ CPU không quá 10 năm tuổi
+ RAM tối thiểu 8GB
+ Không cần GPU riêng

- Mô hình trung bình (7-8 tỷ tham số):
+ Cần GPU với ít nhất 8GB VRAM để tăng hiệu suất
+ Vẫn có thể chạy trên CPU nhưng sẽ chậm hơn

- Mô hình trung cấp (14-32 tỷ tham số):
+ Mô hình 14B: GPU tối thiểu 12GB VRAM, khuyến nghị 16GB
+ Mô hình 32B: Cần 24GB VRAM để đạt hiệu suất tối ưu
+ Có thể chạy với VRAM thấp hơn nhưng sẽ phân tán tải trên GPU, CPU và RAM

- Mô hình lớn (70-671 tỷ tham số):
+ Mô hình 70B: Yêu cầu GPU 48GB VRAM
+ Mô hình 671B: Cần 480GB VRAM tổng cộng
+ Phải dùng hệ thống nhiều GPU:
* 20 card Nvidia RTX 3090 (24GB/card)
* Hoặc 10 card Nvidia RTX A6000 (48GB/card)

- Các yếu tố quan trọng khi triển khai:
+ Cần đảm bảo nguồn điện và hệ thống làm mát đầy đủ
+ Kiểm tra tính tương thích giữa các GPU
+ Tính toán chi phí tiêu thụ điện dài hạn
+ Khả năng mở rộng trong tương lai

📌 DeepSeek R1 cung cấp nhiều lựa chọn từ mô hình nhỏ 1,5 tỷ tham số chạy được trên CPU đến mô hình khổng lồ 671 tỷ tham số đòi hỏi 20 GPU RTX 3090. Việc chọn cấu hình phù hợp với nhu cầu và ngân sách là yếu tố quyết định thành công khi triển khai.

https://www.geeky-gadgets.com/hardware-requirements-for-deepseek-r1-ai-models/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute AI market 2025-02-04 12:27:21

Intel cho thấy vì sao Nvidia vẫn khó bị đánh bại dù DeepSeek gây chấn động

Intel quyết định không ra mắt chip Falcon Shores, loại GPU tăng tốc AI được kỳ vọng sẽ cạnh tranh với Nvidia. Thay vào đó, con chip này chỉ được sử dụng như một giải pháp thử nghiệm nội bộ.
Nvidia chịu ảnh hưởng sau tin tức về DeepSeek, một startup AI Trung Quốc đã phát triển mô hình AI tiên tiến với chi phí thấp hơn, làm dấy lên lo ngại về sự suy giảm nhu cầu đối với sản phẩm của Nvidia.
Cổ phiếu Nvidia mất hơn 18% giá trị trong tuần qua, nhưng giới phân tích vẫn chưa chắc chắn liệu công nghệ của DeepSeek có thực sự làm thay đổi thị trường AI hay không.
Mark Zuckerberg (Meta) cho rằng nhu cầu tính toán AI vẫn sẽ tiếp tục tăng, với kế hoạch đầu tư tới 65 tỷ USD vào hạ tầng và điện toán AI trong năm nay, so với dưới 40 tỷ USD năm ngoái.
Intel tiếp tục gặp khó khăn trong mảng AI, khi doanh số chip Gaudi AI thế hệ thứ ba thấp hơn kỳ vọng, không đạt mục tiêu doanh thu 500 triệu USD trong năm 2024.
Nvidia chuẩn bị ra mắt loạt chip Blackwell, dự kiến sẽ tạo doanh thu hơn 75 tỷ USD trong năm tài chính 2026, vượt xa tổng doanh thu của Intel (chỉ hơn 53 tỷ USD trong cùng kỳ).
Blackwell được thiết kế để hoạt động trên các rack server, một số phiên bản yêu cầu hệ thống làm mát bằng chất lỏng để xử lý khối lượng tính toán khổng lồ trong các trung tâm dữ liệu AI.
Intel dự kiến ra mắt hệ thống AI Jaguar Shores, nhưng khả năng cạnh tranh với Blackwell của Nvidia vẫn còn là dấu hỏi lớn.
Chuyên gia Rick Schafer (Oppenheimer) nhận định Intel không có chỗ đứng đáng kể trong thị trường AI data center, và điều đó khó có thể thay đổi trước năm 2027.
Intel gặp khủng hoảng tài chính nghiêm trọng, đã tiêu gần 15,7 tỷ USD tiền mặt trong năm 2024 – năm thứ ba liên tiếp có dòng tiền tự do âm, do phải đầu tư vào dây chuyền sản xuất chip và kinh doanh gia công chip (foundry).
Giới phân tích dự báo Intel sẽ tiếp tục đốt 9,9 tỷ USD tiền mặt trong năm 2025, khiến tình hình tài chính ngày càng bấp bênh.
Cổ phiếu Intel giảm hơn 50% trong năm qua, mất 17% sau khi CEO Pat Gelsinger bất ngờ bị thay thế vào tháng 12.
Morgan Stanley cảnh báo Intel không còn nhiều thời gian để xoay chuyển tình hình, và việc đưa ra sản phẩm tốt hơn là điều duy nhất có thể giúp hãng vực dậy.

📌

Intel từ bỏ chip AI Falcon Shores, đánh mất cơ hội cạnh tranh trực tiếp với Nvidia.
Nvidia chịu ảnh hưởng từ DeepSeek, nhưng các chuyên gia vẫn tin rằng nhu cầu AI sẽ tiếp tục tăng mạnh.
Meta tăng cường đầu tư AI lên 65 tỷ USD, trong khi Nvidia chuẩn bị ra mắt dòng chip Blackwell với doanh thu kỳ vọng 75 tỷ USD năm 2026.
Intel gặp khó khăn với dòng chip Gaudi AI, Jaguar Shores chưa rõ khả năng cạnh tranh.
Tình hình tài chính của Intel xấu đi với 15,7 tỷ USD tiền mặt bị đốt trong năm 2024, cổ phiếu giảm hơn 50% trong vòng một năm.

https://www.wsj.com/tech/intel-shows-why-nvidia-is-still-hard-to-beat-92344c34

#WSJ

Intel cho thấy vì sao Nvidia vẫn khó bị đánh bại

Cổ phiếu Nvidia sụt giảm sau tin tức về DeepSeek, nhưng Intel ngày càng chật vật trong cuộc đua chip AI
Dan Gallagher
Ngày 3 tháng 2, 2025 – 5:30 sáng ET

Intel đã quyết định không đưa chip Falcon Shores ra thị trường. Falcon Shores là loại chip tương tự đã giúp Nvidia trở thành thế lực trong lĩnh vực trí tuệ nhân tạo.

Nvidia có thể trông kém “bất khả chiến bại” hơn so với trước đây. Nhưng Intel vừa cho thấy rằng thách thức gã khổng lồ AI này vẫn là một nhiệm vụ không hề dễ dàng.

Báo cáo quý IV của Intel công bố vào tối thứ Năm diễn ra sau một tuần đầy biến động đối với Nvidia. Nhà thiết kế chip AI và hệ thống máy tính này đã mất hơn 18% giá trị vốn hóa thị trường sau khi thế giới biết đến những đột phá kỹ thuật của startup AI Trung Quốc DeepSeek. Những tiến bộ đó cho thấy có thể xây dựng các mô hình AI tiên tiến với chi phí tính toán tương đối thấp, điều mà nhiều người tin rằng có thể dẫn đến nhu cầu giảm đối với sản phẩm của Nvidia.

Tuy nhiên, viễn cảnh đó vẫn còn xa vời. Mark Zuckerberg, CEO của Meta Platforms và là một trong những khách hàng lớn nhất của Nvidia, đã nói trong cuộc họp báo cáo thu nhập tuần trước rằng “vẫn còn quá sớm” để biết liệu những tiến bộ của DeepSeek có làm giảm nhu cầu chi tiêu vốn (capex) cho AI hay không. Nhưng ông cũng nói rằng sức mạnh tính toán cao hơn vẫn sẽ dẫn đến hệ thống AI tốt hơn, vì vậy “đầu tư rất mạnh vào capex và cơ sở hạ tầng sẽ là lợi thế chiến lược theo thời gian.” Meta dự kiến chi tới 65 tỷ USD cho capex trong năm nay, so với mức chưa đến 40 tỷ USD của năm ngoái.

Tuy nhiên, Intel có thể không giành được nhiều lợi ích từ khoản chi tiêu đó. Trong cuộc họp báo cáo thu nhập quý IV tối thứ Năm, đồng CEO của Intel, Michelle Johnston Holthaus, cho biết công ty đã quyết định không đưa chip Falcon Shores ra thị trường. Trước đó, Intel có kế hoạch ra mắt bộ tăng tốc GPU—loại chip đã giúp Nvidia trở thành cái tên số một trong lĩnh vực AI—vào cuối năm nay. Nhưng Holthaus cho biết, dựa trên “phản hồi từ ngành,” công ty đã quyết định chỉ sử dụng Falcon Shores như một chip thử nghiệm nội bộ khi phát triển hệ thống AI dựa trên rack.

Điều này đồng nghĩa với việc Intel vẫn phải đối đầu với Nvidia ngay trên sân nhà của đối thủ. Dòng chip mới nhất của Nvidia, có tên Blackwell, cũng được thiết kế cho các hệ thống rack server, với một số phiên bản yêu cầu hệ thống làm mát bằng chất lỏng để vận hành trong các trung tâm dữ liệu. Nhưng nhu cầu đối với các sản phẩm này vẫn chưa hạ nhiệt. Theo Visible Alpha, các nhà phân tích dự đoán doanh thu từ dòng Blackwell có thể vượt 75 tỷ USD trong năm tài chính tới của Nvidia, kết thúc vào tháng 1 năm 2026. Trong cùng khoảng thời gian, tổng doanh thu của Intel được dự báo chỉ hơn 53 tỷ USD.

Falcon Shores không phải là thất bại đầu tiên của Intel trong nỗ lực cạnh tranh với Nvidia. Trong cuộc họp báo cáo quý III ba tháng trước, Intel cho biết phiên bản thứ ba của chip tăng tốc AI Gaudi đang có nhu cầu yếu và sẽ không đạt được mục tiêu doanh số khiêm tốn là 500 triệu USD vào năm 2024. Triển vọng của hệ thống AI rack-based sắp ra mắt mang tên Jaguar Shores cũng rất bấp bênh—đặc biệt là khi Nvidia sẽ xuất xưởng các hệ thống Blackwell với số lượng lớn trong 12 tháng tới. “Intel không có sự hiện diện đáng kể nào trong mảng AI trung tâm dữ liệu,” Rick Schafer của Oppenheimer viết trong một ghi chú gửi khách hàng vào thứ Sáu. “Chúng tôi không kỳ vọng điều đó sẽ thay đổi trước năm 2027.”

Intel sẽ trông như thế nào vào thời điểm đó vẫn là một dấu hỏi lớn. Gã khổng lồ chip từng rất giàu tiền mặt đã tiêu tốn gần 15,7 tỷ USD trong năm ngoái—năm thứ ba liên tiếp có dòng tiền tự do âm—khi theo đuổi kế hoạch tái cấu trúc đầy tham vọng để bắt kịp công nghệ sản xuất, xây dựng mảng xưởng đúc chip cho các công ty khác và ngăn chặn sự mất thị phần trước sự cạnh tranh mạnh mẽ từ Nvidia và Advanced Micro Devices.

“Cách dễ nhất để giải quyết những câu hỏi này là đưa ra các sản phẩm tốt hơn, nhưng rõ ràng điều đó sẽ cần thời gian,” Joseph Moore của Morgan Stanley viết vào thứ Sáu. Tuy nhiên, theo FactSet, các nhà phân tích dự đoán Intel sẽ tiếp tục đốt 9,9 tỷ USD trong năm nay. Cổ phiếu Intel cũng đã mất hơn một nửa giá trị trong năm qua và giảm gần 17% kể từ khi CEO Pat Gelsinger bất ngờ bị sa thải vào tháng 12. Thời gian không còn là thứ Intel có nhiều nữa.

Liên hệ với Dan Gallagher tại [email protected]

Intel Shows Why Nvidia Is Still Hard to Beat
Nvidia’s shares took a beating on the DeepSeek news, but Intel’s struggles to break into the AI chip market keep growing
By
Dan Gallagher
Feb. 3, 2025 5:30 am ET

Intel has decided against bringing its Falcon Shores chip to market. Falcon Shores is the same type of chip that has made Nvidia a force in artificial intelligence.
Nvidia might look a little less invincible these days. But Intel has just shown that challenging the AI powerhouse is still no easy task.
Intel’s fourth-quarter report late Thursday followed a bruising week for Nvidia. The designer of artificial-intelligence chips and computing systems shed more than 18% of its market value after the world caught wind of technical breakthroughs by Chinese AI startup DeepSeek. Those developments suggested it is possible to build advanced AI models on a relatively low computing cost, which many believed could lead to lower demand for Nvidia’s products.
That outcome is still far from certain. Mark Zuckerberg, chief executive of Meta Platforms and one of Nvidia’s largest customers, said during his own earnings call last week that “it’s way too early” to know whether DeepSeek’s developments will lead to lower capital-spending needs for AI. But he added that more powerful computing will still lead to better AI systems, so “investing very heavily in capex and infra is going to be a strategic advantage over time.” Meta plans to spend as much as $65 billion in capex this year, compared with just under $40 billion last year.
Intel might not be getting much of a piece of that, though. In the chip maker’s own fourth-quarter earnings call late Thursday, Intel Co-CEO Michelle Johnston Holthaus said the company has decided to not bring its Falcon Shores chip to market. Intel had been planning to launch the GPU accelerator—the same type of chip that has made Nvidia the name to beat in artificial intelligence—later this year. But citing “industry feedback,” Holthaus said the company has decided to use Falcon Shores as an internal test chip only, as it develops a rack-based system for AI computing.
That still puts Intel in the position of challenging Nvidia on the latter’s home turf. Nvidia’s latest chip family, known as Blackwell, is also available on server racks, some versions of which are so demanding that they require liquid-based cooling systems to be installed in the data centers that use them. That still isn’t cooling demand for those products; analysts expect revenue from the Blackwell family alone to surpass $75 billion in Nvidia’s next fiscal year, which ends in January 2026, according to Visible Alpha. Intel’s entire business is projected to generate just over $53 billion in revenue for roughly the same period.
Falcon Shores isn’t Intel’s first flameout in trying to go after Nvidia. In its third-quarter call three months ago, Intel said the third version of its Gaudi AI accelerator chip was seeing weak demand and would fall short of its modest sales target of $500 million for 2024. The outlook for its coming rack-based system called Jaguar Shores is also highly uncertain—especially because Nvidia will be shipping Blackwell systems in high volume over the next 12 months. “Intel has no meaningful [data center] AI presence,” Rick Schafer of Oppenheimer wrote in a note to clients on Friday. “We don’t expect that to change before 2027.”
What Intel even looks like as a company by that point is a big question mark. The once-flush chip giant burned nearly $15.7 billion in cash last year—its third straight year of negative free cash flow—as it pursues an ambitious turnaround plan to catch up its manufacturing technology, builds a foundry business that makes chips for other companies, and stems the market-share loss its own products have been experiencing because of robust competition from the likes of Nvidia and Advanced Micro Devices.
“The easiest way to address these questions is to see better products come to market, and that’s clearly going to take time,” wrote Joseph Moore of Morgan Stanley on Friday. But analysts are projecting a cash burn of $9.9 billion this year, according to FactSet. Intel’s stock also has lost more than half its value over the past year, and nearly 17% since the surprise push-out of CEO Pat Gelsinger in December. Time is something that Intel no longer has in abundance.
Write to Dan Gallagher at [email protected]

Không có file đính kèm.

Nguồn tham khảo

124

AI chips-hardware-compute AI pháp lý-quản trị-chủ quyền 2025-02-04 12:22:10

HPE, AMD và Nvidia hợp tác với Ấn Độ để phát triển GPU nội địa và thúc đẩy hệ sinh thái AI

3 tập đoàn công nghệ lớn – Hewlett Packard Enterprise (HPE), Advanced Micro Devices (AMD) và Nvidia – đang đàm phán với chính phủ Ấn Độ để hợp tác phát triển GPU nội địa và xây dựng hệ sinh thái AI trong nước.
Theo một quan chức cấp cao, thông báo chính thức về thỏa thuận này sẽ sớm được công bố. Nvidia từ chối bình luận, trong khi HPE và AMD chưa phản hồi.
Bộ trưởng Bộ Điện tử & CNTT Ashwini Vaishnaw xác nhận chính phủ đang thảo luận với ngành công nghiệp về việc thiết kế GPU nội địa và cam kết hỗ trợ sáng kiến này.
Trung tâm Phát triển Điện toán Tiên tiến (C-DAC) cùng các công ty toàn cầu sẽ tham gia vào dự án, với mục tiêu giúp Ấn Độ tự chủ về phần cứng AI.
Bộ Điện tử & CNTT (MeitY) đã chốt danh sách các công ty sẽ nhận hỗ trợ từ chính phủ để mua GPU và phát triển hạ tầng tính toán AI, với tổng số GPU đề xuất vượt mức 18.000 – gần gấp đôi mục tiêu ban đầu (10.000).
Hiện tại, siêu máy tính lớn nhất của Ấn Độ chỉ sử dụng 700 GPU, cho thấy mức tăng trưởng mạnh trong đầu tư điện toán AI của nước này.
GPU được sử dụng bao gồm Nvidia H100, H200, A100, L4; AMD MI 325X và Intel Gaudi-2, mở rộng khả năng tính toán AI từ phân khúc cao cấp đến tầm trung.
Giá thuê điện toán GPU theo yêu cầu chỉ từ 64 Rs/giờ (~$0,77/giờ), trong khi chính phủ dự kiến cung cấp dịch vụ tính toán AI với giá chỉ $1/giờ – mức thấp nhất thế giới.
Ấn Độ hướng đến phát triển GPU nội địa có hiệu suất thấp hơn nhưng tối ưu chi phí, tương tự như cách Trung Quốc sử dụng GPU giá rẻ để phát triển AI nội địa (DeepSeek).
Chính phủ Ấn Độ cũng đang kêu gọi startup và nhà phát triển tham gia vào AI Mission trị giá 10.000 crore Rs (~$1,2 tỷ) để xây dựng các mô hình AI nền tảng.
Hiện có 6 nhà phát triển trong nước đang nghiên cứu các mô hình AI cốt lõi với sự hỗ trợ của chính phủ.
Nvidia bày tỏ mong muốn hợp tác phát triển chip tại Ấn Độ, tận dụng năng lực thiết kế chip sẵn có của nước này.
HPE sẽ đóng vai trò cung cấp hạ tầng máy chủ tối ưu hóa cho GPU, hỗ trợ tải tính toán AI.
AMD, vốn đã tham gia thị trường GPU từ năm 2006 sau khi mua ATI Technologies, ủng hộ một hệ sinh thái AI mở, cảnh báo rằng độc quyền sẽ cản trở đổi mới.

📌 Ấn Độ hợp tác với Nvidia, AMD và HPE để phát triển GPU nội địa, hỗ trợ hệ sinh thái AI trong nước.

Chính phủ đã nhận đề xuất hỗ trợ mua 18.000 GPU, gần gấp đôi mục tiêu ban đầu.
Ấn Độ đặt mục tiêu cung cấp điện toán AI giá rẻ chỉ từ $1/giờ cho startup và nghiên cứu.
GPU được sử dụng bao gồm Nvidia H100, AMD MI 325X, Intel Gaudi-2, mở rộng từ phân khúc cao cấp đến giá rẻ.
Ấn Độ khuyến khích startup tham gia vào AI Mission trị giá 10.000 crore Rs (~$1,2 tỷ) để phát triển mô hình AI nội địa.
Nvidia muốn hợp tác phát triển chip tại Ấn Độ, HPE cung cấp hạ tầng AI, AMD cảnh báo về nguy cơ độc quyền AI.

https://www.business-standard.com/technology/tech-news/global-tech-firms-nvidia-amd-hpe-in-talks-with-govt-for-indigenous-gpus-125020301433_1.html

Global tech giants collaborate with India on GPUs and AI development

India leads AI-driven workplace transformation, reportIndia emerges a key smartphone market amid Chinese dominanceBudget has been kind to IndiaAI mission, Semiconductor 2.0 shortchangedIndia’s electronics sector set to gain from US tariff on ChinaBSNL budget allocation cut by 59%, down to ₹33,757.58 crore in 2025Union Budget earmarks ₹9,000 crore for electronics PLI schemeUnion Budget-DoS gets ₹13,416.2 cr in budget, up from ₹11,725.7 crUnion Budget-Govt expects 33 pc lower revenue from telecom at Rs 82,443 cr in FY26Union Budget-Govt to expand broadband under BharatNetUnion Budget to enhance infra, electronics manufacturingUnion Budget 2025-26: Telecom & Enterprise Networks, Industry RespondsMHA mandates telcos test TCIL’s anti-spam solution for 90 daysIndia to launch its own safe & secure indigenous AI modelIndian industry warming up to DeepSeekEconomic Survey to be tabled in Parliament’s Budget Session, starts todayUnion Budget Expectations, Ambrane IndiaGovt to launch new PLI scheme for telecom equipment manufacturingNxtGen, E2E, and Jio emerge lowest bidders for IndiaAI mission GPUsBSNL going strong with TCSJio’s new voice and SMS plans receive backlash from usersTech firms may go to Court, as Govt readies for upper 6GHz band auctionVodafone makes world’s first satellite video call using standard smartphoneMicrosoft, Meta defend hefty AI spendingWith MTNL loans turning into NPAs, PSBs head for 20% haircutTake Control of Your Data- Data Privacy Day celebratedIndia takes ‘wait and watch’ approach to China’s AI disruptionTelangana govt to develop two new IT parks in Hyderabad suburbsIndia lacks funding, infrastructure to lead in AI, say VCsStarlink accepts govt terms for India satellite broadband licenseBSNL joins hands with Skypro & PlayboxTV launched ‘IFTV’ in IndiaAssam to become semiconductor hub, electronic city to rise in JagiroadOf 29 companies interested initially, 3 bid for BSNL’s 5G tenderIndia tops global app market with 25 billion downloadsMeitY calls for proposals to build India’s own AI foundation modelPre-budget recommendations, SEMIAdani, Ambani join legal battle against OpenAIPre-budget recommendations, NasscomA PLI scheme for non-electronic components in the offingTRAI seems keen to delay 2G upgradesDraft DPDP rules pave way for startup boom in consent managementSC, not the govt is authorised to waive off AGRAirtel set to compete with Starlink in satellite internet raceRandeep Sekhon appointed Non-Executive Director, Dialog Axiata PLCGovt revisiting AGR definition, might result in ₹82000cr relief for non telcosStargate initiative’s scale and scope present collateral opportunities for IndiaGujarat positions itself as IT hub with nearly ₹7,000 cr investmentReliance and Nvidia to build world’s largest data center in JamnagarIndia poised to take global lead in AI innovationHow Starlink’s arrival in Bangladesh may affect telecom market

Global tech giants collaborate with India on GPUs and AI development

Three global technology players — Hewlett Packard Enterprise (HPE), Advanced Micro Devices (AMD), and Nvidia — are in discussions with the Indian government for a collaborative effort to help design and develop “indigenous” graphic processing units (GPUs), as well as in building the artificial intelligence (AI) ecosystem in the country.

Talks are ongoing, according to a senior government official, with an announcement on the final terms of collaboration expected soon. A spokesperson for Nvidia declined to comment, while HPE and AMD did not respond to queries.

In a recent interview with Business Standard, Minister for Electronics and Information Technology, Railways, and Information & Broadcasting Ashwini Vaishnaw stated that the government has begun consultations with the industry on India-designed GPUs and will support the initiative. He added that discussions have already taken place with the Centre for Development of Advanced Computing, as well as with global firms that could assist in the effort.

These discussions come as the Ministry of Electronics and Information Technology (Meity) finalises a list of companies empaneled to receive government support for procuring GPUs and developing computing infrastructure critical for AI. The government has received offers for more than 18,000 GPUs — nearly double its initial target of 10,000. For context, India’s largest supercomputer currently operates on 700 GPUs.

Industry applications, according to sources, include a range of GPUs, such as Nvidia’s H100, H200, A100, and L4; AMD’s MI 325X; and Intel’s Gaudi-2, among others.

Prices for on-demand computing start as low as Rs 64 per hour, according to industry sources. Vaishnaw has said the government aims to provide computing power to startups, research centers, and universities at roughly $1 per hour — one of the lowest rates globally.

While the proposed India-designed GPUs may not match the world’s most advanced processing power, sources familiar with the matter say they will offer a cost-effective solution with potential for innovation in AI applications. A similar approach has been seen in China, where the DeepSeek generative AI tool has developed a lower-cost model compared to ChatGPT, relying on less advanced GPUs with reduced processing power.

The Indian government is also considering asking proposals from startups and developers, offering incentives to create foundational AI models under its Rs 10,000 crore AI mission. Vaishnaw, in a recent press conference, stated that six developers are currently working on foundational AI models in the country.

Nvidia, for its part, has expressed interest in co-developing a chip in India by leveraging the country’s chip design capabilities. HPE plays a critical role in providing server infrastructure optimised for GPUs, enhancing AI-driven computational workloads. AMD, an old player in the GPU market since its 2006 acquisition of ATI Technologies, has advocated for a collaborative AI ecosystem, warning that monopolisation could stifle innovation and harm everyone. Business Standard

India leads AI-driven workplace transformation, report

We create rich business content, reach targeted business audiences, and provide valuable business information to our readers.

Không có file đính kèm.

Nguồn tham khảo

107

AI chips-hardware-compute 2025-02-01 13:13:54

Nvidia quảng cáo GPU mới nhất cho DeepSeek AI

- Nvidia công bố dòng GPU RTX 50-series mới có thể chạy các mô hình DeepSeek nhanh nhất trên thị trường PC

- Thị trường vốn hóa của Nvidia vừa chịu tổn thất một ngày lớn nhất trong lịch sử các công ty Mỹ, nguyên nhân chính đến từ DeepSeek

- DeepSeek chứng minh mô hình suy luận R1 của họ không cần phần cứng Nvidia mạnh mẽ vẫn đạt hiệu suất tương đương mô hình o1 của OpenAI

- Công ty Trung Quốc này đã tiết kiệm được chi phí đáng kể trong quá trình huấn luyện mô hình

- DeepSeek sử dụng GPU H800 yếu hơn của Nvidia - phiên bản được phép xuất khẩu sang Trung Quốc theo quy định của chính phủ Mỹ

- Nvidia khẳng định GPU RTX 50-series mới dựa trên kiến trúc Blackwell, cung cấp hiệu suất suy luận tối đa cho DeepSeek trên PC

- Trung Quốc chỉ nhận được phiên bản RTX 5090 ít mạnh mẽ hơn

- Các công ty công nghệ khác cũng đang tận dụng làn sóng DeepSeek: AWS và Microsoft đã tích hợp R1 vào nền tảng của họ

- Microsoft và OpenAI đang điều tra khả năng DeepSeek sử dụng dữ liệu của OpenAI theo báo cáo từ Bloomberg

📌 Thành công của DeepSeek với mô hình R1 đã gây ra cú sốc lớn cho Nvidia khi chứng minh không cần GPU cao cấp vẫn có thể phát triển AI hiệu quả. Điều này khiến Nvidia mất giá trị vốn hóa kỷ lục trong một ngày và có thể ảnh hưởng đến vị thế độc quyền của công ty trong tương lai.

https://www.theverge.com/news/604412/nvidia-rtx-50-series-gpus-deepseek

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-02-01 12:43:22

Chi phí thực của DeepSeek có thể cao gấp 100 lần so với công bố, lên tới 500 triệu USD

- DeepSeek trở thành chủ đề nóng trong tuần khi công bố chi phí đào tạo mô hình AI chỉ 5,576 triệu USD, dựa trên giá thuê GPU của Nvidia

- Ứng dụng DeepSeek Assistant vượt qua ChatGPT để đứng đầu bảng xếp hạng ứng dụng miễn phí trên App Store của Apple tại Mỹ

- Cổ phiếu công nghệ toàn cầu giảm mạnh, riêng Nvidia và Broadcom mất tổng cộng 800 tỷ USD vốn hóa thị trường vào ngày thứ Hai

- Báo cáo mới từ SemiAnalysis ước tính chi phí phần cứng thực tế của DeepSeek vượt xa 500 triệu USD, bao gồm chi phí nghiên cứu phát triển và tạo dữ liệu tổng hợp

- DeepSeek được thành lập năm 2023 bởi Liang Wenfeng, đồng sáng lập quỹ đầu tư High-Flyer, và hiện vẫn thuộc sở hữu hoàn toàn của High-Flyer

- Mô hình R1 của DeepSeek được phát hành dưới dạng nguồn mở, cho phép các nhà phát triển AI sử dụng tự do

- Sam Altman, CEO của OpenAI, công nhận R1 là "mô hình tuyệt vời" nhưng cũng nghi ngờ DeepSeek đã thu thập dữ liệu của OpenAI một cách không phù hợp

- Chatbot của DeepSeek có giới hạn về một số chủ đề nhạy cảm liên quan đến chính trị Trung Quốc

📌 DeepSeek gây bất ngờ khi công bố chi phí đào tạo mô hình chỉ 5,6 triệu USD, nhưng con số thực tế có thể lên tới 500 triệu USD theo SemiAnalysis. Dù vậy, khả năng của mô hình R1 được đánh giá cao, thậm chí được CEO OpenAI Sam Altman công nhận, cho thấy tiềm năng cạnh tranh của AI Trung Quốc.

https://www.cnbc.com/2025/01/31/deepseeks-hardware-spend-could-be-as-high-as-500-million-report.html

Không có file đính kèm.

Nguồn tham khảo

AI pháp lý-quản trị-chủ quyền AI chips-hardware-compute 2025-02-01 01:12:31

Căng thẳng công nghệ AI Mỹ-Trung: Trump khẩn cấp gặp CEO Nvidia sau cú sốc từ DeepSeek

- Tổng thống Trump sẽ gặp CEO Nvidia Jensen Huang tại Nhà Trắng vào thứ Sáu, sau khi mô hình AI mới của công ty DeepSeek của Trung Quốc gây chấn động thị trường chứng khoán Mỹ

- Mô hình AI mới của DeepSeek đã khiến cổ phiếu Nvidia và các công ty công nghệ khác giảm mạnh vào thứ Hai, làm dấy lên cuộc tranh luận tại Washington về việc kiểm soát chặt chẽ hơn việc xuất khẩu chip Nvidia

- Chính quyền Trump đang điều tra xem DeepSeek có mua chip Nvidia thông qua các đơn vị trung gian ở Singapore hay không

- Một số quan chức đang xem xét thắt chặt hơn nữa các hạn chế hiện có đối với việc bán chip Nvidia cho Trung Quốc

- Trump đã ký sắc lệnh hành pháp yêu cầu nhóm liên ngành xây dựng chính sách trong vòng 6 tháng để đảm bảo vị thế dẫn đầu của Mỹ trong lĩnh vực AI

- Kế hoạch đầu tư cơ sở hạ tầng AI trị giá 100 tỷ USD được công bố với sự tham gia của Sam Altman (OpenAI), Masayoshi Son (SoftBank) và Larry Ellison (Oracle), với mục tiêu đạt 500 tỷ USD trong tương lai

- Sam Altman của OpenAI đã ám chỉ về những tiến bộ mới trong sản phẩm của công ty trong cuộc họp kín, đồng thời kêu gọi các nhà lập pháp Mỹ tiếp tục đầu tư mạnh vào cơ sở hạ tầng vật lý để hỗ trợ phát triển AI

📌 Cuộc gặp Trump-Huang phản ánh mối lo ngại của Mỹ về sự tiến bộ của AI Trung Quốc qua DeepSeek. Mỹ đáp trả bằng kế hoạch đầu tư 100 tỷ USD vào cơ sở hạ tầng AI và thắt chặt kiểm soát xuất khẩu chip sang Trung Quốc.

https://www.bloomberg.com/news/articles/2025-01-31/nvidia-ceo-huang-to-meet-trump-at-white-house-on-friday

CEO Nvidia, Jensen Huang, sẽ gặp Trump tại Nhà Trắng vào thứ Sáu

Cuộc gặp là dấu hiệu mới nhất cho thấy Trump tập trung vào công nghệ AI
Diễn ra sau khi mô hình AI mới của Trung Quốc gây lo ngại

Tổng thống Donald Trump sẽ gặp CEO của Nvidia Corp., Jensen Huang, tại Nhà Trắng vào thứ Sáu, theo nguồn tin thân cận. Cuộc gặp diễn ra chỉ vài ngày sau khi mô hình AI mới của DeepSeek, một startup Trung Quốc, khiến các lãnh đạo ngành công nghệ lo lắng và làm chao đảo thị trường chứng khoán Mỹ.

Đây là dấu hiệu mới nhất cho thấy Trump đang ngày càng cam kết với lĩnh vực AI, vốn đang phát triển nhanh chóng. Đồng thời, cuộc gặp cũng diễn ra vào thời điểm khó khăn của Nvidia—hãng sản xuất chip hàng đầu thế giới. Kế hoạch gặp mặt được tiết lộ bởi các nguồn tin giấu tên.

Sự kiện DeepSeek ra mắt mô hình AI mạnh mẽ đã khiến cổ phiếu Nvidia cùng nhiều công ty công nghệ khác lao dốc vào thứ Hai. Điều này cũng khơi mào một cuộc tranh luận tại Washington về việc Mỹ nên kiểm soát chặt chẽ đến đâu đối với bộ vi xử lý của Nvidia, vốn đang trở thành một lá bài chiến lược địa chính trị.

Trump và các đồng minh của ông nhanh chóng trấn an những lo ngại về mô hình AI mới và hiệu quả hơn của Trung Quốc, dù nó có thể báo hiệu rằng Bắc Kinh đã bắt kịp Mỹ trong lĩnh vực trí tuệ nhân tạo. Ông gọi đây là một “hồi chuông cảnh tỉnh” và một “bước phát triển tích cực”.

Nvidia từ chối bình luận về kế hoạch gặp gỡ giữa Huang và Trump.

Theo Bloomberg, chính quyền Trump đã bắt đầu xem xét liệu DeepSeek có mua chip Nvidia thông qua các bên trung gian ở Singapore hay không. Một số quan chức đang cân nhắc siết chặt các lệnh hạn chế hiện có đối với doanh số bán chip của Nvidia sang Trung Quốc nhằm ngăn chặn mẫu chip mới nhất được thiết kế riêng cho thị trường này.

Trump cũng tuyên bố rằng các giải pháp AI mới của Mỹ sẽ sớm được công bố. Hôm thứ Năm, Sam Altman, CEO của OpenAI, đã hé lộ những bước tiến mới trong sản phẩm của công ty trong một cuộc họp kín, đồng thời kêu gọi các nhà lập pháp Mỹ tiếp tục đầu tư mạnh vào cơ sở hạ tầng vật lý để hỗ trợ sự phát triển của AI trong tương lai.

Đầu tháng này, Trump đã ký một sắc lệnh hành pháp, yêu cầu định hướng chính sách AI mới bằng cách thành lập một nhóm liên ngành để soạn thảo chính sách trong vòng 6 tháng, nhằm đảm bảo sự thống trị của Mỹ trong lĩnh vực này. Ông cũng công bố một khoản đầu tư cơ sở hạ tầng AI trị giá 100 tỷ USD, với mục tiêu 500 tỷ USD trong tương lai. Các khoản đầu tư này đến từ Sam Altman (OpenAI), Masayoshi Son (SoftBank Group Corp.) và Larry Ellison (Oracle Corp.).

Nvidia CEO Huang to Meet Trump at White House on Friday
Meeting is latest sign of Trump’s focus on AI technology
Sitdown comes after new Chinese AI model sparked concern
Jensen HuangPhotographer: David Paul Morris/Bloomberg
By Stephanie Lai, Mackenzie Hawkins, and Josh Wingrove
January 31, 2025 at 2:28 PM UTC
President Donald Trump will meet with Nvidia Corp. chief executive Jensen Huang at the White House on Friday, according to people familiar, days after a new Chinese AI model from DeepSeek sparked concern among technology industry leaders and tanked the US stock market.
The meeting is the latest sign of Trump’s growing commitment to the rapidly evolving sphere of AI technology and comes at the end of a rocky week for the world’s leading chipmaker. Plans for the meeting were shared by people familiar on condition of anonymity.
The recent debut of a powerful AI model from Chinese startup DeepSeek sent Nvidia and other tech stocks into a tailspin Monday and triggered a debate in Washington about how strictly the US should control Nvidia processors that have become points of geopolitical leverage.
Trump and his allies quickly sought to tamp down worries over the new and more efficient Chinese AI model despite it signaling that the Chinese may have caught up with US technological capacity on artificial intelligence. He has described it as a “wake-up call” and a “positive development.”
Nvidia declined to comment on the planned meeting between Huang and Trump.
Bloomberg has reported that the Trump administration has begun looking into whether DeepSeek purchased Nvidia chips through intermediaries in Singapore. Some officials are eying tightening existing curbs on Nvidia sales to China to capture the most recent model the chipmaker designed for that market.
Trump also said that new “AI solutions” from the US would be introduced in the near future. On Thursday, OpenAI’s Sam Altman teased new advances in OpenAI’s products in a closed door meeting, while urging US lawmakers to continue investing heavily in physical infrastructure to support future artificial intelligence development.
Earlier this month, Trump signed an executive order that demands a new AI policy direction by ordering an interagency group to craft policy within six months intended to ensure US dominance in the field. He also unveiled a $100 billion artificial intelligence infrastructure investment — with goals of $500 billion down the road — from Altman, SoftBank Group Corp.’s Masayoshi Son and Oracle Corp.’s Larry Ellison.

Không có file đính kèm.

Nguồn tham khảo

143

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-01-31 20:21:23

Sam Altman họp kín với chính trị gia Mỹ kêu gọi đầu tư cơ sở hạ tầng AI sau thành công của DeepSeek

- Sam Altman, CEO OpenAI, đã có buổi họp kín với các quan chức Quốc hội và Nhà Trắng vào ngày 30/1/2025 về việc đầu tư cơ sở hạ tầng AI

- Dự án Stargate trị giá 100 tỷ USD là liên doanh giữa OpenAI, SoftBank và Oracle, hiện đang trong giai đoạn mời thầu các địa điểm xây dựng

- Sự xuất hiện của DeepSeek từ Trung Quốc, với mô hình AI mới có hiệu suất ngang bằng các dịch vụ hàng đầu của Mỹ, cho thấy tính cấp thiết của dự án Stargate

- OpenAI đã dành nhiều tháng vận động chính quyền Biden về việc hỗ trợ xây dựng trung tâm dữ liệu AI trong nước. Hiện nay họ đang điều chỉnh thông điệp phù hợp với chính quyền Trump, tập trung vào cơ hội tăng trưởng kinh tế trong nước và mối lo ngại về Trung Quốc

- DeepSeek tuyên bố đã xây dựng dịch vụ của họ với chi phí thấp hơn nhiều so với các đối thủ, gây áp lực lên chiến lược đầu tư quy mô lớn của OpenAI

- Altman và đội ngũ của ông tiết lộ những tiến bộ mới trong sản phẩm của OpenAI, hướng tới các dịch vụ có thể thực hiện các tác vụ phức tạp hơn

- OpenAI nhấn mạnh nhu cầu tăng cường năng lực tính toán để cải thiện mô hình AI và hỗ trợ lượng người dùng ngày càng tăng

📌 Trước sự vươn lên của DeepSeek Trung Quốc với chi phí thấp, OpenAI thúc đẩy dự án Stargate 100 tỷ USD nhằm duy trì vị thế dẫn đầu của Mỹ trong cuộc đua AI toàn cầu, tập trung vào phát triển cơ sở hạ tầng và năng lực tính toán.

https://www.bloomberg.com/news/articles/2025-01-30/openai-s-altman-urges-us-to-support-ai-investment-after-deepseek

Altman của OpenAI kêu gọi Mỹ hỗ trợ đầu tư AI sau sự kiện DeepSeek

Mackenzie Hawkins
30 tháng 1 năm 2025, 15:27 UTC

Giám đốc điều hành OpenAI, Sam Altman, đã trình bày với các nhà hoạch định chính sách Mỹ về sự cần thiết phải tiếp tục đầu tư mạnh vào cơ sở hạ tầng vật lý để hỗ trợ phát triển trí tuệ nhân tạo (AI) trong tương lai, chỉ vài ngày sau khi cơn sốt xung quanh công ty khởi nghiệp DeepSeek của Trung Quốc làm dấy lên hoài nghi mới về chi tiêu cho AI.

Tại một cuộc họp kín ở Washington vào thứ Năm, có sự tham dự của các quan chức Quốc hội và Nhà Trắng, Altman cho rằng sự trỗi dậy của DeepSeek là “một điều rất tốt” để thúc đẩy dự án hạ tầng chung trị giá 100 tỷ USD giữa OpenAI, SoftBank Group Corp. và Oracle Corp. Altman cho biết dự án này, được Tổng thống Donald Trump công bố vào tuần trước với tên gọi Stargate, hiện đang kêu gọi đấu thầu cho các địa điểm trong tương lai.

Các giám đốc OpenAI đã dành nhiều tháng để thuyết phục chính quyền Biden về sự cần thiết phải hỗ trợ một mạng lưới trung tâm dữ liệu AI quy mô lớn trong nước. Giờ đây, họ đang điều chỉnh thông điệp của mình cho chính quyền Trump, tập trung vào cơ hội tăng trưởng kinh tế trong nước và mối lo ngại về Trung Quốc.

Lập luận này càng trở nên thuyết phục hơn trong những ngày gần đây, sau khi DeepSeek ra mắt một mô hình mới có hiệu năng ngang ngửa với dịch vụ của OpenAI và các nhà phát triển AI hàng đầu của Mỹ, cho thấy Trung Quốc có thể đang bắt kịp Mỹ. Tuy nhiên, thông điệp của OpenAI về sự cần thiết phải đầu tư mạnh mẽ cũng trở nên phức tạp hơn bởi tuyên bố của DeepSeek rằng họ đã xây dựng dịch vụ với chi phí chỉ bằng một phần nhỏ.

Tại cuộc họp hôm thứ Năm, Altman và nhóm của ông đã giới thiệu những tiến bộ mới trong sản phẩm của OpenAI, đồng thời cho biết các nhà phát triển AI đang hướng tới việc cung cấp những dịch vụ có thể “thực hiện các nhiệm vụ ngày càng phức tạp cho người dùng.” Tuy nhiên, khi các công ty công nghệ xây dựng những sản phẩm tinh vi hơn, ông nhấn mạnh rằng “chúng ta sẽ cần nhiều tài nguyên tính toán hơn nữa,” cả để cải thiện mô hình AI và để hỗ trợ nhu cầu sử dụng ngày càng tăng.

“Có một cuộc cạnh tranh thực sự trên thế giới, và chúng tôi rất hào hứng với bước tiếp theo này,” Altman nói.

OpenAI’s Altman Urges US to Support AI Investment After DeepSeek

By Mackenzie Hawkins
January 30, 2025 at 3:27 PM UTC

OpenAI Chief Executive Officer Sam Altman briefed US policymakers on the need to continue investing heavily in physical infrastructure to support future artificial intelligence development, days after the frenzy around Chinese upstart DeepSeek cast new doubt on AI spending.
In a closed-door gathering in Washington on Thursday attended by officials from Congress and the White House, Altman said the rise of DeepSeek shows “it’s a really good thing” to push ahead with the $100 billion joint infrastructure venture between OpenAI, SoftBank Group Corp. and Oracle Corp. Altman said the project, announced last week by President Donald Trump and called Stargate, is currently soliciting bids for future sites.
OpenAI executives spent months pitching the Biden administration on the need to support a massive domestic AI data center buildout. They’re now tailoring their message for Trump with a focus on domestic economic growth opportunities and concerns about China.
That pitch has only gained new resonance in recent days after DeepSeek released a new model that rivals the performance of services from OpenAI and other leading American developers, suggesting China may be catching up to the US. But OpenAI’s messaging about the need for intense investment has also been complicated by DeepSeek’s claims that it built the service for a small fraction of the cost.
At the gathering on Thursday, Altman and his team teased new advances in OpenAI’s products and said AI developers are moving toward services that can “do increasingly complex tasks for you.” But as tech companies build more sophisticated products, he said, “we’ll need much more compute,” both to improve the AI models and support growing usage.
“There is a very real competition in the world, and we’re very excited about the next step here,” he said.

Không có file đính kèm.

Nguồn tham khảo

107

AI chips-hardware-compute 2025-01-28 15:05:47

Nvidia quay cuồng sau sự đột phá của AI của Trung Quốc

- Cổ phiếu Nvidia giảm 17% vào ngày 27/1/2025, làm mất khoảng 600 tỷ USD giá trị thị trường sau khi công ty DeepSeek của Trung Quốc công bố đột phá về AI

- DeepSeek chứng minh có thể huấn luyện hệ thống AI tiên tiến chỉ với một phần nhỏ số chip Nvidia mà OpenAI đã sử dụng cho ChatGPT

- Nvidia hiện kiểm soát 90% thị phần chip chuyên dụng để xây dựng hệ thống AI

- Doanh thu của Nvidia đã tăng hơn 200% lên 126 tỷ USD trong 2 năm qua, giá trị công ty tăng 700% tính đến thứ Sáu tuần trước, đạt đỉnh 3,62 nghìn tỷ USD vào tháng 11/2024

- Đột phá của DeepSeek cũng kéo theo sự sụt giảm cổ phiếu của các công ty bán dẫn khác như Broadcom, Micron Technology và Taiwan Semiconductor Manufacturing Inc

- Các lãnh đạo AI cảnh báo về sự chậm lại trong cải tiến chatbot do thiếu dữ liệu, khiến các công ty phải tìm kiếm kỹ thuật mới

- Jensen Huang, CEO Nvidia, khẳng định tại CES 2025 rằng các kỹ thuật mới đang thúc đẩy nhu cầu chip của Nvidia

- Apple hiện đang dẫn đầu về giá trị thị trường sau khi ra mắt hệ thống Apple Intelligence cho iPhone, tuy nhiên đã phải vô hiệu hóa một số tính năng do khách hàng phàn nàn về việc phần mềm diễn giải sai các báo cáo tin tức

📌 Đột phá của DeepSeek đã làm lung lay vị thế độc quyền của Nvidia trong thị trường chip AI, khiến cổ phiếu giảm 17% và mất 600 tỷ USD vốn hóa. Sự kiện này cho thấy xu hướng mới trong việc phát triển AI với chi phí thấp hơn và hiệu quả cao hơn.

https://www.nytimes.com/2025/01/27/business/deepseek-nvidia-ai-chips.html

Nvidia lao đao sau bước đột phá về AI của Trung Quốc
Ngành công nghệ đã có một cơn "thèm khát không giới hạn" đối với chip của Nvidia trong 2 năm qua. Tuy nhiên, "bữa tiệc" này có thể kết thúc sớm hơn dự đoán của nhiều người.

Tác giả: Tripp Mickle
Tường thuật từ San Francisco
Ngày 27 tháng 1 năm 2025
Cập nhật: 4:43 chiều giờ ET

Nvidia, công ty đã vươn lên vị trí dẫn đầu trên thị trường chứng khoán nhờ việc bán các con chip máy tính thúc đẩy sự bùng nổ trí tuệ nhân tạo trên toàn cầu, vừa bị giáng một đòn thực tế khó khăn bởi một công ty nhỏ của Trung Quốc, cho thấy họ có thể đạt được nhiều kết quả hơn với lượng chip Nvidia ít hơn nhiều.

Hôm thứ Hai, cổ phiếu của Nvidia đã giảm 17%, sau khi công ty có tên DeepSeek trình bày rằng họ có thể huấn luyện một hệ thống AI tiên tiến chỉ với một phần nhỏ số chip Nvidia từng được OpenAI sử dụng trước đây, nhà sản xuất ChatGPT. Nvidia mất khoảng 600 tỷ USD giá trị thị trường, đây là ngày giao dịch tồi tệ nhất kể từ đợt bán tháo do đại dịch vào tháng 3 năm 2020.

Công bố của DeepSeek đã thách thức sự đồng thuận trong ngành công nghệ rằng, để xây dựng các hệ thống AI lớn hơn và tốt hơn, các công ty sẽ phải chi hàng tỷ đô la vào các trung tâm dữ liệu mới. Tâm điểm của các trung tâm dữ liệu này sẽ là thứ mà, có lẽ cho đến nay, không dự án AI nào có thể thiếu: một lượng lớn chip của Nvidia.

Theo một số ước tính, công ty ở Thung lũng Silicon này kiểm soát 90% thị trường chip chuyên dụng dùng để xây dựng các hệ thống AI. Nvidia đã có một giai đoạn phát triển vượt bậc kể từ khi OpenAI ra mắt ChatGPT vào cuối năm 2022. Trong 2 năm qua, doanh thu của Nvidia đã tăng hơn 200%, đạt 126 tỷ USD, trong khi tổng giá trị công ty tăng vọt 700% tính đến khi đóng cửa thị trường hôm thứ Sáu, đạt đỉnh 3,62 nghìn tỷ USD vào tháng 11.

Tuy nhiên, bước đột phá rõ ràng của DeepSeek đã chỉ ra rằng nhu cầu đối với chip Nvidia có thể không vô hạn như nhiều người tưởng tượng cách đây chỉ một tuần. Dù Nvidia vẫn đang ở một vị trí đáng ghen tị — với rất ít đối thủ cạnh tranh trong thị trường chip AI — các công ty mua công nghệ của Nvidia có thể sẽ giảm tốc độ chi tiêu.

“Trước đây, AI lớn hơn, tốt hơn, nhanh hơn. Chip lớn hơn đồng nghĩa với khả năng AI lớn hơn,” Patrick Moorhead, giám đốc điều hành của Moor Insights & Strategy, một công ty nghiên cứu về công nghệ và bán dẫn, cho biết. “Nhưng điều này diễn ra quá nhanh, đặt ra câu hỏi về thời gian mà điều đó còn đúng với Nvidia và liệu người ta có còn cần nhiều chip của Nvidia trong tương lai hay không.”

Thông báo của DeepSeek cũng kéo theo giá cổ phiếu của các công ty bán dẫn khác giảm, bao gồm Broadcom, Micron Technology và Taiwan Semiconductor Manufacturing Inc.

Sự xuất hiện của DeepSeek đã làm rõ thêm một mối lo ngại vốn đã phủ bóng lên hoạt động kinh doanh của Nvidia. Cuối năm ngoái, các lãnh đạo AI bắt đầu cảnh báo rằng sự cải tiến của chatbot đang chậm lại. Trước đây, họ dựa vào một công thức đơn giản để đạt được những bước tiến: thu thập càng nhiều dữ liệu càng tốt từ internet và đẩy vào các mô hình ngôn ngữ lớn — công nghệ nền tảng của chatbot — trên những máy tính ngày càng lớn hơn.

Nhưng khái niệm đó, được biết đến trong ngành công nghiệp với tên gọi Scaling Laws, đã bắt đầu mất dần ưu thế vì các công ty công nghệ đang cạn kiệt dữ liệu. Điều này đã khiến các công ty bắt đầu thử nghiệm các kỹ thuật mới để tiếp tục cải tiến hệ thống của họ. Đồng thời, điều đó cũng làm dấy lên câu hỏi từ các nhà đầu tư của Nvidia về những hậu quả có thể xảy ra đối với hoạt động kinh doanh.

Tại triển lãm công nghệ CES vào tháng 1, Jensen Huang, giám đốc điều hành của Nvidia, cho biết các kỹ thuật mới đang “tạo ra nhu cầu khổng lồ đối với chip của Nvidia.” Ông nói rằng các công ty đang sử dụng chip của Nvidia để vận hành các mô hình xử lý dữ liệu nhiều hơn tại các trung tâm dữ liệu, đồng nghĩa với việc nhu cầu đối với công nghệ của Nvidia sẽ tăng lên, chứ không giảm đi.

Trong một tuyên bố vào thứ Hai, Mylene Mangalindan, phát ngôn viên của Nvidia, cho biết DeepSeek cho thấy các kỹ thuật mới đang hoạt động hiệu quả. Bà còn nói thêm rằng, “DeepSeek là một bước tiến xuất sắc trong lĩnh vực AI.”

Tuy nhiên, các nhà đầu tư đã theo dõi sát sao để xem liệu sự thay đổi trong cách phát triển AI có làm suy giảm hoạt động kinh doanh của Nvidia hay không, và thành công của DeepSeek làm dấy lên những lo ngại về việc liệu xây dựng và cung cấp các hệ thống AI có trở nên rẻ hơn hay không.

“Đây là điều mà mọi người đã nỗ lực hướng tới,” Daniel Newman, giám đốc điều hành của Futurum Group, một công ty nghiên cứu công nghệ, chia sẻ. “Ai cũng đang theo đuổi mục tiêu này vì chi phí đào tạo AI quá cao.”

Không phải ai cũng tin rằng sự tăng trưởng của Nvidia đang chững lại. Cổ phiếu của công ty đã từng dao động mạnh và giảm hơn 10% vào tháng 8 năm ngoái khi có thông tin công ty sẽ trì hoãn việc giao dòng chip AI mới nhất. Sau đó, cổ phiếu lại phục hồi.

Trong một bản ghi chú gửi nhà đầu tư vào thứ Hai, Stacy Rasgon, một nhà phân tích bán dẫn tại Bernstein Research, cho rằng DeepSeek đã chi nhiều tiền hơn so với những gì họ công bố để xây dựng hệ thống của mình. Ông bổ sung rằng khả năng xây dựng các hệ thống AI hiệu quả hơn sẽ đồng nghĩa với việc nhu cầu sẽ tăng lên vì nhiều công ty có thể đủ khả năng đầu tư vào chúng.

“Cơn hoảng loạn cuối tuần qua có vẻ đã bị thổi phồng quá mức,” ông Rasgon nhận xét.

Những thay đổi trong giá trị của Nvidia là minh chứng mới nhất cho cách AI tiếp tục làm chao đảo thị trường chứng khoán. Năm ngoái, Microsoft đã vượt qua Apple để trở thành công ty giá trị nhất thế giới nhờ đẩy mạnh đầu tư sớm vào AI. Đến tháng 6, Nvidia vượt qua cả hai công ty để giành vị trí dẫn đầu.

Hiện tại, Apple đã trở lại vị trí số 1 sau khi ra mắt hệ thống AI của riêng mình có tên là Apple Intelligence dành cho iPhone. Nhưng có dấu hiệu cho thấy Apple khó giữ vị trí này lâu. Tháng này, Apple đã phải vô hiệu hóa một trong những tính năng nổi bật của hệ thống — tổng hợp và tóm tắt thông báo tin tức — sau khi khách hàng và các công ty phàn nàn rằng phần mềm này đưa ra các báo cáo sai lệch về tin tức.

“Chưa có ai thực sự thắng cuộc ở đây,” ông Newman nói. “Các công cụ hiện tại chỉ ở mức tạm được. Nhưng nếu mọi người đều có thể tạo ra các mô hình tốt hơn với chi phí thấp hơn, thì AI có thể bắt đầu được ứng dụng rộng rãi.”

Tripp Mickle là phóng viên đưa tin về Apple và Thung lũng Silicon cho The Times, làm việc tại San Francisco. Ông tập trung vào các sản phẩm mới của Apple, các vấn đề sản xuất và thách thức chính trị. Ông cũng viết về các xu hướng trong ngành công nghệ, bao gồm sa thải nhân sự, AI tạo sinh và taxi tự động.

Nvidia Reels After China’s A.I. Breakthrough
The tech industry has had an insatiable appetite for Nvidia’s chips over the last two years. But the feast may be over sooner than many had expected.

By Tripp Mickle
Reporting from San Francisco
Jan. 27, 2025
Updated 4:43 p.m. ET
Nvidia, which soared to the top of the stock market by selling the computer chips fueling the world’s artificial intelligence boom, has been dealt a tough reality check by a small Chinese company that showed it could do more with less of what Nvidia makes.
On Monday, shares of Nvidia plunged 17 percent after the company, called DeepSeek, showed that it could train a cutting-edge A.I. system with a fraction of the Nvidia chips that had been used in the past by OpenAI, the maker of ChatGPT. The company lost roughly $600 billion in market value, on what was its worst trading day since the pandemic sell-off in March 2020.
DeepSeek’s release challenged a tech industry consensus that in order to build bigger and better A.I. systems, companies would have to spend billions and billions of dollars on new data centers. At the center of those data centers would be the one thing that, perhaps until now, no A.I project could do without: a huge cache of Nvidia’s chips.
The Silicon Valley company, by some estimates, controls 90 percent of the market for specialized chips used to build A.I. systems. It has had a remarkable run since OpenAI released ChatGPT in late 2022. Over the past two calendar years, Nvidia’s revenue has jumped more than 200 percent to $126 billion, while the total value of the company has rocketed 700 percent as of Friday’s market close, peaking at $3.62 trillion in November.
But DeepSeek’s apparent breakthrough has shown that the appetite for Nvidia’s chips may not be as limitless as some had imagined just a week ago. While Nvidia is still in an enviable position — there is little competition for its A.I. chips — the companies that have been buying its technology could slow down their spending.
“Before, A.I. was bigger, better, faster. Bigger chips equal bigger A.I. capabilities,” said Patrick Moorhead, chief executive of Moor Insights & Strategy, a tech and semiconductor research firm. “But this was so quick it raises questions about how long that is true for Nvidia and whether people will need as many of its chips in the future.”
The DeepSeek release also dragged down shares of other semiconductor companies, including Broadcom, Micron Technology and Taiwan Semiconductor Manufacturing Inc.
DeepSeek’s arrival has crystallized a concern that was already casting a shadow over Nvidia’s business. Late last year, A.I. leaders began to warn that the improvements to chatbots were slowing down. They had previously relied on a simple formula to deliver advances: culling as much data as possible from the internet and pushing into large language models — the technology that powers chatbots — on ever-bigger computers.
But that concept, which is known in the industry as Scaling Laws, has begun to fall out of favor because tech companies are running out of data. That has led companies to begin to experiment with new techniques to keep improving their systems. It has also fueled questions from Nvidia investors about the repercussions for its business.
At the CES technology trade show in January, Jensen Huang, Nvidia’s chief executive, said that the new techniques were “driving enormous demand for Nvidia’s chips.” He said that companies are using Nvidia’s chips to power models that do more reasoning in data centers, which means there will be more demand for its technology, not less.
In a statement on Monday, Mylene Mangalindan, Nvidia’s spokeswoman, said DeepSeek shows that those new techniques are working. She added that “DeepSeek is an excellent A.I. advancement.”
But investors have been watching to see if the change in the way A.I. is being made would throttle Nvidia’s business, and DeepSeek’s success speaks to uncertainty about whether it will be cheaper to build and deliver A.I. systems.
“This was something that we have been working toward,” said Daniel Newman, chief executive of Futurum Group, a tech research firm. “Everyone has been pursuing this goal because the costs of training A.I. was too high.”
Not everyone is convinced that Nvidia’s rise is stalling. Its stock has been volatile and tumbled in August by more than 10 percent over reports the company would delay shipping its newest artificial intelligence chip. It later rebounded.
In a note for investors on Monday, Stacy Rasgon, a semiconductor analysts at Bernstein Research, said DeepSeek spent more money to build its system than it claimed. He added that being able to build more A.I. systems more efficiently should mean more demand because more companies can afford to invest in them.
The panic over the weekend, Mr. Rasgon said, “seems overblown.”
The changes in Nvidia’s value is the latest testament to how A.I. continues to upend the stock market. Last year, Microsoft replaced Apple as the world’s most valuable company for its early push into A.I. In June, Nvidia surged past both companies to claim the crown.
Now, Apple is back in the lead after it released its own A.I. system called Apple Intelligence for iPhones. But there are signs that it may not hold that position for long. This month, it disabled one of the signature capabilities — aggregating and summarizing news notifications — after customers and companies complained that its software was misrepresenting news reports.
“There hasn’t been a winner here,” Mr. Newman said. “The tools have been just OK. But if everyone can make better models at lower costs, then people may start adopting A.I.”
Tripp Mickle reports on Apple and Silicon Valley for The Times and is based in San Francisco. His focus on Apple includes product launches, manufacturing issues and political challenges. He also writes about trends across the tech industry, including layoffs, generative A.I. and robot taxis

Không có file đính kèm.

Nguồn tham khảo

138

AI chips-hardware-compute AI & công nghệ khác 2025-01-27 23:02:26

Zhan Ketuan - tỷ phú công nghệ Trung Quốc thất thế: Từ "vua" bitcoin đến nạn nhân chiến tranh chip Mỹ-Trung

- Zhan Ketuan, tỷ phú 45 tuổi người Trung Quốc, đang đối mặt khủng hoảng khi Mỹ tịch thu các lô hàng máy đào bitcoin của công ty Bitmain

- Các công ty AI của Zhan bao gồm Xiamen Sophgo Technologies và 15 công ty liên kết vừa bị Mỹ đưa vào danh sách đen thương mại

- Vấn đề nảy sinh khi phát hiện chip AI do TSMC sản xuất xuất hiện trong card AI của Huawei, có khả năng phá vỡ lệnh trừng phạt

- Bitmain từng chiếm 80% thị phần máy đào bitcoin toàn cầu nhờ tiếp cận chip của TSMC

- Năm 2017, doanh thu Bitmain đạt 2,5 tỷ USD theo hồ sơ IPO

- Zhan chuyển hướng sang AI từ 2017 với chip BM1680, nhưng gặp khủng hoảng khi giá bitcoin sụt giảm

- Xung đột nội bộ xảy ra giữa Zhan và đồng sáng lập Wu Jihan về chiến lược phát triển AI

- Năm 2022, hoạt động chip AI được chuyển sang Sophgo, công ty có mối liên hệ chặt chẽ với Bitmain

- Chip CPU SG2042 của Sophgo được đánh giá ngang tầm Intel và AMD trong một số tác vụ siêu máy tính

- Nhiều trung tâm siêu máy tính Trung Quốc đã bắt đầu sử dụng chip của Sophgo sau khi bị cắt tiếp cận chip Mỹ

📌 Từ ông vua máy đào bitcoin với 80% thị phần toàn cầu, tỷ phú Zhan Ketuan đối mặt thách thức lớn khi bị Mỹ cấm vận. Tham vọng xây dựng "Nvidia của Trung Quốc" bị đe dọa nghiêm trọng sau khi 16 công ty liên quan bị đưa vào danh sách đen và mất quyền tiếp cận công nghệ chip từ TSMC.

https://www.ft.com/content/46c48898-c468-45e8-bbaf-b655939c941a

#FT

Zhan Ketuan: Tỷ phú tiền mã hóa và AI Trung Quốc trở thành mục tiêu của Mỹ

Ryan McMorrow tại Bắc Kinh và Kathrin Hille tại Đài Bắc

Zhan Ketuan, tỷ phú trong lĩnh vực tiền mã hóa và trí tuệ nhân tạo của Trung Quốc, đang đối mặt với một cuộc khủng hoảng.

Các quan chức hải quan Mỹ trong những tháng gần đây đã tịch thu một số lô hàng máy đào Bitcoin do công ty Bitmain của Zhan sản xuất. Áp lực đối với tỷ phú 45 tuổi này tăng lên trong tháng này, sau khi Washington áp đặt các biện pháp trừng phạt đối với các công ty khác của ông, chuyên thiết kế và cung cấp bộ xử lý AI.

Đây không phải lần đầu tham vọng xây dựng “Nvidia của Trung Quốc” của Zhan khiến đế chế kinh doanh của ông gặp rủi ro. Cách đây 5 năm, Bitmain suýt sụp đổ vì các khoản đầu tư lớn của ông vào việc phát triển chip AI, dẫn đến cuộc chiến nội bộ với đồng sáng lập để giành quyền kiểm soát công ty.

Dù Bitmain vẫn tập trung vào khai thác tiền mã hóa, Zhan đã chuyển các nỗ lực phát triển chip AI sang công ty Xiamen Sophgo Technologies. Tháng này, Sophgo cùng 15 công ty liên kết khác đã bị đưa vào danh sách thực thể của Bộ Thương mại Mỹ.

Rắc rối của Sophgo bắt đầu khi một bộ xử lý AI do nhà sản xuất chip hàng đầu thế giới, Taiwan Semiconductor Manufacturing Company (TSMC), chế tạo được phát hiện trong một card AI của Huawei, bị cáo buộc vi phạm lệnh trừng phạt. TSMC đã mở cuộc điều tra xem liệu Sophgo có mua chip này hay không.

Mỹ tuyên bố rằng Sophgo có nguy cơ chuyển giao công nghệ cho Huawei và cáo buộc công ty này “hoạt động dưới sự chỉ đạo của Bắc Kinh” nhằm tăng cường sản xuất chip nội địa của Trung Quốc.

Sophgo, Bitmain và Zhan không phản hồi yêu cầu bình luận. Trước đây Sophgo đã phủ nhận việc hợp tác với Huawei, và Bitmain tuyên bố không liên quan đến vấn đề này.

TSMC từ chối bình luận về quan hệ khách hàng nhưng khẳng định họ là một công ty tuân thủ pháp luật và cam kết thực hiện đầy đủ các quy định, bao gồm cả kiểm soát xuất khẩu.

Những thách thức mới nhất của Zhan cho thấy những trở ngại mà các doanh nhân Trung Quốc phải đối mặt, đặc biệt là những người muốn ghi dấu ấn trong lĩnh vực sản xuất chip, nơi căng thẳng địa chính trị Mỹ-Trung đã làm chậm tiến trình của nhiều công ty công nghệ đầy tham vọng tại Trung Quốc.

Những người am hiểu về hoạt động của Sophgo cho biết công ty này có một số mảng kinh doanh liên quan đến bán dẫn, bao gồm thiết kế bộ xử lý AI và bộ xử lý trung tâm cho siêu máy tính, cũng như cung cấp GPU tiên tiến của Nvidia cho các trung tâm dữ liệu ở Trung Quốc.

Danh sách đen của Mỹ chính thức cắt đứt Sophgo khỏi TSMC, và điều này có thể gây khó khăn cho Bitmain, đối tác của Sophgo, vì Bitmain cũng phụ thuộc vào nhà sản xuất chip Đài Loan để chế tạo sản phẩm của mình.

Những người thân cận với Bitmain cho biết khả năng tiếp cận TSMC đã giúp công ty này trở thành nhà sản xuất máy đào Bitcoin hàng đầu thế giới với thị phần ước tính 80%. Trong nhiều năm, Bitmain đã chi hàng trăm triệu USD để đặt trước năng lực sản xuất của TSMC, buộc các nhà sản xuất máy đào đối thủ phải sử dụng các nhà máy chip kém hiệu quả hơn.

“Con chip tiết kiệm năng lượng là trái tim của một máy đào,” Nishant Sharma, nhà sáng lập công ty tư vấn khai thác tiền mã hóa BlocksBridge Consulting, cho biết.

Zhan từng thiết kế chip cho TV khi Bitcoin bắt đầu thu hút sự chú ý. Năm 2013, ông chuyển khả năng kỹ thuật của mình sang thiết kế các bộ xử lý chuyên dụng (ASICs) để thực thi hiệu quả hơn các thuật toán băm giúp khai thác Bitcoin. Đến năm 2017, doanh thu của Bitmain đã tăng vọt lên 2,5 tỷ USD, theo hồ sơ IPO của công ty.

Tầm nhìn của Zhan đối với công ty đã mở rộng sang lĩnh vực AI. Ở Mỹ, Google vừa ra mắt các ASIC để vận hành thuật toán học sâu, gọi là TPU.

“Chúng tôi là một công ty tập trung vào các bộ xử lý hiệu năng cao,” Zhan phát biểu tại một hội nghị ở Bắc Kinh năm 2017. “Chúng tôi bắt đầu với các bộ xử lý tiền mã hóa và giờ đang bước vào lĩnh vực trí tuệ nhân tạo. Đây là một lĩnh vực ứng dụng mới, nhưng không phải là một sự chuyển hướng hoàn toàn.”

Zhan Ketuan và hành trình xây dựng đế chế AI của Trung Quốc

Chip AI đầu tiên của Bitmain, BM1680, được TSMC sản xuất và xuất xưởng vào năm 2017. Tuy nhiên, sau đó giá Bitcoin giảm mạnh, kéo theo nhu cầu đối với máy đào tiền mã hóa cũng suy giảm. Kế hoạch IPO "bom tấn" của Bitmain tại Hồng Kông cũng tan thành mây khói.

Công ty đã sa thải hàng trăm nhân viên, và Wu Jihan, đồng sáng lập của Zhan, đã lật đổ ông và cắt giảm chi tiêu cho AI. Zhan phản công bằng cách nắm quyền kiểm soát một đơn vị chip AI của Bitmain, đăng ký tại quê nhà của ông ở Phúc Kiến, và kiện Wu. Công ty, Fujian Sophon, nói với tòa rằng việc Zhan bị loại bỏ có nguy cơ làm thay đổi hướng đi của “sự phát triển chip và blockchain của đất nước”. Cuối cùng, Wu rời đi.

Đến năm 2022, Zhan chuyển các nỗ lực phát triển chip AI của Bitmain sang Sophgo, công ty mà ông gần như sở hữu hoàn toàn khi nó được thành lập. Tuy nhiên, ranh giới giữa 2 công ty vẫn mờ nhạt. Các thực thể liên kết của Bitmain và Sophgo chia sẻ một số giám đốc điều hành, địa chỉ và số điện thoại trong các hồ sơ kinh doanh chính thức tại Trung Quốc. Năm ngoái, họ cùng nhau tuyển dụng sinh viên mới tốt nghiệp tại Học viện Công nghệ Cáp Nhĩ Tân, theo một quảng cáo.

Một khách hàng sử dụng chip AI của họ, Haitu Technology, đã mô tả Sophgo là “nhà phân phối được khuyến nghị” của Bitmain trong một hồ sơ gửi cơ quan quản lý chứng khoán Trung Quốc vào cuối năm 2022. Haitu cũng cho biết Bitmain không bán bộ xử lý AI của mình cho các công ty vừa và nhỏ.

Theo một bài thuyết trình của công ty được Financial Times xem, Sophgo đã cung cấp chip AI của mình cho các cục an ninh công cộng và các dự án thành phố thông minh ở Phúc Kiến, An Huy và Bắc Kinh. Các bộ tăng tốc AI của công ty cũng được sử dụng để xây dựng một cụm điện toán AI ở Sơn Đông.

Nick Brown, một nhà nghiên cứu tại Đại học Edinburgh, cho biết CPU mới nhất của Sophgo, SG2042, đánh dấu một bước tiến vượt bậc cho kiến trúc mã nguồn mở RISC-V mà nó được xây dựng trên đó. Theo ông, SG2042 có thể so sánh với các bộ xử lý của Intel và AMD trong một số tác vụ siêu máy tính.

“Với các khối lượng công việc đòi hỏi nhiều tính toán, nhiều xử lý và nhiều phép tính, nó hoạt động rất tốt,” Brown nói sau khi thử nghiệm con chip này trên phần cứng siêu máy tính của đại học.

“Đây là CPU RISC-V đầu tiên có thể được coi là một lựa chọn nghiêm túc cho các tác vụ hiệu năng cao,” Brown nhận xét.

Hồ sơ công khai cho thấy một số trung tâm siêu máy tính ở Trung Quốc, vốn bị cắt nguồn cung chip Mỹ, đã bắt đầu sử dụng các bộ xử lý của Sophgo.

“Một khi các công ty Trung Quốc có chỗ đứng, các công ty phương Tây về cơ bản sẽ không còn cơ hội,” Zhan nói tại một hội thảo vào năm 2019. Giờ đây, Sophgo sẽ phải tìm cách sản xuất các bộ xử lý của mình tại Trung Quốc.

Báo cáo bổ sung từ Eleanor Olcott và Nian Liu tại Bắc Kinh.

Không có file đính kèm.

Nguồn tham khảo

116

Semi-Cloud-DC-Green AI chips-hardware-compute 2025-01-26 20:18:16

Cuộc tranh luận nảy lửa tại Davos giữa các nhà lãnh đạo AI về dự án Stargate trị giá 500 tỷ USD

- Tại Diễn đàn kinh tế thế giới (WEF) ở Davos, các nhà lãnh đạo AI hàng đầu tranh luận gay gắt về những rủi ro của công nghệ AI đang phát triển nhanh chóng

- Sir Demis Hassabis (Google DeepMind), Dario Amodei (Anthropic) và Yoshua Bengio cảnh báo về các mối đe dọa từ AI, đặc biệt khi AI đạt đến trí tuệ tổng quát (AGI) vượt qua khả năng nhận thức của con người

- Yann LeCun của Meta chỉ trích quan điểm này là đạo đức giả, cho rằng những lo ngại về an toàn mâu thuẫn với việc các công ty vẫn đang cạnh tranh quyết liệt để phát triển các mô hình AI tốt nhất

- OpenAI, SoftBank và Oracle công bố dự án cơ sở hạ tầng AI "Stargate" trị giá 500 tỷ USD, với cam kết đầu tư ban đầu 15 tỷ USD từ mỗi bên OpenAI và SoftBank

- Donald Trump ủng hộ dự án này và ký sắc lệnh loại bỏ nhiều rào cản trong phát triển AI

- Microsoft đặt nghi vấn về cam kết tài chính của Stargate, đồng thời công bố kế hoạch đầu tư 80 tỷ USD vào cơ sở hạ tầng

- Meta thông báo chi tiêu 60-65 tỷ USD cho cơ sở hạ tầng trong năm nay

- Mối quan hệ giữa OpenAI và Microsoft có dấu hiệu rạn nứt sau khi thỏa thuận độc quyền điện toán đám mây bị chấm dứt

- xAI của Elon Musk đã xây dựng siêu máy tính "Colossus" với 100.000 chip Nvidia và dự định mở rộng gấp 10 lần

📌 Cuộc đua cơ sở hạ tầng AI bùng nổ với tổng đầu tư lên đến hơn 700 tỷ USD từ các ông lớn công nghệ, trong đó Stargate (500 tỷ USD) và Microsoft (80 tỷ USD) dẫn đầu, đồng thời làm dấy lên lo ngại về an toàn AI và sự phân hóa trong ngành.

https://www.ft.com/content/174c2759-c5b8-42ed-adc2-8d5f659f5982

#FT

Các lãnh đạo AI xung đột về an toàn và dự án Stargate trị giá 100 tỷ USD
Những nhân vật hàng đầu trong lĩnh vực AI như Demis Hassabis của DeepMind và Yann LeCun của Meta tranh luận gay gắt tại Davos.

Các nhân vật lớn trong lĩnh vực trí tuệ nhân tạo đã tranh cãi về những nguy cơ của công nghệ đang phát triển nhanh chóng tại Diễn đàn Kinh tế Thế giới tuần này, trong khi sự phấn khích bao trùm dự án cơ sở hạ tầng AI trị giá 500 tỷ USD được Donald Trump quảng bá.

Các nhà tiên phong AI, bao gồm giám đốc Google DeepMind Sir Demis Hassabis, đồng sáng lập Anthropic Dario Amodei và "cha đẻ AI" Yoshua Bengio, đã tận dụng sự kiện ở Davos để nhấn mạnh những cảnh báo nghiêm trọng về các mối đe dọa từ AI, khi các lợi ích thương mại và cạnh tranh địa chính trị dường như đang áp đảo những mối lo ngại về an toàn.

Trong khi Hassabis thừa nhận rằng “con quỷ đã ra khỏi chai” (ngụ ý việc không thể quay lại trạng thái ban đầu), ông cảnh báo rằng trí tuệ nhân tạo tổng quát (artificial general intelligence - AGI) — khi máy tính vượt qua khả năng nhận thức của con người — có thể đe dọa nền văn minh nếu nó vượt ngoài tầm kiểm soát hoặc bị các thế lực xấu chiếm đoạt. Đặc biệt nguy hiểm là các mô hình ngôn ngữ lớn (large language models - LLM) “mở nguồn” và có thể truy cập bởi tất cả mọi người.
“Điều đang bị đe dọa ở đây lớn hơn nhiều so với chỉ là các công ty hay sản phẩm,” người đoạt giải Nobel nói trong một cuộc phỏng vấn với Financial Times. “[Đó là] tương lai của nhân loại, điều kiện sống của con người và nơi mà chúng ta muốn hướng đến với tư cách là một xã hội.”

Amodei, người sáng lập start-up chế tạo chatbot Claude, được Google và Amazon hỗ trợ, bày tỏ lo ngại về việc các chính phủ độc tài sử dụng AI và cho biết ông “rất lo ngại về các kịch bản kiểu 1984, hoặc tệ hơn.”
“Ngành khoa học hiện chưa biết cách kiểm soát các cỗ máy có trí thông minh ngang với chúng ta, và thậm chí còn tồi tệ hơn nếu chúng thông minh hơn chúng ta,” Bengio bổ sung trong một phiên thảo luận. “Có người nói, ‘Đừng lo lắng, chúng ta sẽ tìm ra cách.’ Nhưng nếu chúng ta không tìm ra, bạn có hiểu hậu quả sẽ ra sao không?”

Lập trường của họ bị Yann LeCun, nhà khoa học trưởng về AI tại Meta, chỉ trích là đạo đức giả. Meta đã chi hàng tỷ USD phát triển LLM mã nguồn mở mang tên Llama. LeCun cho rằng những lo ngại này mâu thuẫn với sự cạnh tranh khốc liệt của các đối thủ để phát triển và bán các mô hình tốt nhất.

“Yoshua và Dario đã đưa ra quan điểm phản đối mã nguồn mở, và điều này thực sự rất nguy hiểm,” LeCun nói trong một cuộc phỏng vấn. “Những trở ngại đối với việc phân phối mã nguồn mở sẽ dẫn đến tình trạng bị chi phối bởi một số ít bên, có thể là ở bờ Tây nước Mỹ hoặc Trung Quốc... [trao] quyền lực vào tay một nhóm nhỏ người.”

“Thật kỳ lạ với những người như Dario. Hôm qua chúng tôi đã gặp nhau, và anh ấy nói rằng lợi ích và rủi ro của AI gần như ở cùng một mức độ. Tôi hỏi, ‘Nếu anh thực sự tin điều này, tại sao anh vẫn tiếp tục làm việc trên AI?’” LeCun bổ sung. “Tôi nghĩ anh ấy hơi hai mặt trong vấn đề này.”

Trong khi các nhà khoa học và kỹ sư tranh luận về rủi ro và lợi ích của AI, các giám đốc điều hành doanh nghiệp lại thể hiện sự phấn khích không hề bị kìm hãm trước công nghệ này.
“Không có ai phản đối cả,” Ervin Tu, chủ tịch của tập đoàn đầu tư công nghệ Hà Lan Prosus, nói. “Nếu bạn hiểu được những gì các mô hình ngôn ngữ lớn và các tác nhân được đào tạo trên đó có thể làm, rất khó để không kết luận rằng chúng là những công nghệ mang tính chuyển đổi và sẽ gây xáo trộn mạnh mẽ trong mọi ngành công nghiệp.”

Dự án Stargate trị giá 500 tỷ USD gây chấn động tại Davos
Bầu không khí sôi động tại Davos càng thêm căng thẳng vào thứ Tư khi OpenAI, SoftBank và Oracle công bố một liên doanh hạ tầng AI trị giá 500 tỷ USD tại Mỹ mang tên “Stargate.”

Trump đã tiếp các giám đốc điều hành, bao gồm Sam Altman (OpenAI), Masayoshi Son (SoftBank) và Larry Ellison (Oracle), tại Phòng Bầu dục vào thứ Ba, trước khi ký các sắc lệnh hành pháp trong tuần này nhằm xóa bỏ nhiều rào cản xung quanh sự phát triển của công nghệ AI. Tân tổng thống Mỹ cho biết các động thái này sẽ đảm bảo vị thế dẫn đầu của Mỹ trong công nghệ.
“Tại OpenAI, chúng tôi tin rằng cơ sở hạ tầng là định mệnh,” giám đốc tài chính của OpenAI, Sarah Friar, nói. “[Stargate] tập trung vào việc tăng cường khả năng tính toán. Nhiều khả năng tính toán hơn tạo ra các mô hình tốt hơn. Các mô hình tốt hơn giải quyết được các vấn đề phức tạp hơn và mang lại nhiều lợi ích hơn cho con người và doanh nghiệp.”

Stargate thống trị các cuộc thảo luận tại Davos trong suốt tuần còn lại, với nhiều người, bao gồm Elon Musk, lên mạng xã hội X để đặt câu hỏi về cách bộ ba sẽ tài trợ cho khoản chi tiêu khổng lồ đã hứa.
Financial Times báo cáo vào thứ Sáu rằng Stargate vẫn chưa đảm bảo được nguồn vốn cần thiết, sẽ không nhận được tài trợ từ chính phủ và sẽ chỉ phục vụ OpenAI sau khi hoàn thành. Hiện tại, SoftBank và OpenAI dự kiến đầu tư hơn 15 tỷ USD mỗi bên cho dự án, với hy vọng huy động vốn cổ phần từ các nhà đầu tư hiện tại và vay nợ để tài trợ cho Stargate.

Rạn nứt giữa OpenAI và Microsoft
Liên doanh mới cũng được coi là bằng chứng mới nhất cho thấy rạn nứt trong mối quan hệ giữa Altman và giám đốc điều hành Microsoft, Satya Nadella, cùng với Mustafa Suleyman, cựu đồng sáng lập DeepMind, hiện là giám đốc AI hàng đầu tại Microsoft sau khi rời công ty khởi nghiệp của mình vào đầu năm ngoái.
“Những căng thẳng giữa Mustafa Suleyman và Sam Altman tại Davos năm ngoái chỉ là khởi đầu,” Marc Benioff, giám đốc điều hành Salesforce, cho biết. Công ty này đang cạnh tranh với Microsoft trong việc cung cấp các tác nhân AI cho doanh nghiệp.
“Microsoft hiện đang tăng tốc phát triển AI của riêng họ... Mô hình này phản ánh lịch sử của Microsoft với các ‘đối tác’ của mình,” Benioff nói thêm. “Điều này có thể đánh dấu sự khởi đầu của kết thúc cho mối quan hệ, khiến OpenAI cần mở rộng sang các nền tảng khác nhanh chóng.”

“Marc không hiểu gì về những gì anh ta đang nói,” phát ngôn viên của Microsoft, Frank Shaw, phản bác.

Microsoft đã đầu tư gần 14 tỷ USD vào OpenAI từ năm 2019 và đổi lại, họ thương lượng được quyền sở hữu trí tuệ cũng như trở thành nhà cung cấp dịch vụ điện toán đám mây độc quyền của OpenAI. Tuy nhiên, thỏa thuận này đã bị chấm dứt cùng với việc công bố Stargate.

Tại Davos, Nadella cũng bày tỏ nghi ngờ về các cam kết chi tiêu của Stargate, đồng thời quảng bá kế hoạch chi 80 tỷ USD vào cơ sở hạ tầng của Microsoft.

“Tất cả những gì tôi biết là tôi sẵn sàng với 80 tỷ USD của mình,” Nadella nói, sau đó phản hồi Musk trên nền tảng mạng xã hội X: “Và tất cả số tiền này không phải để thổi phồng AI, mà là để xây dựng những thứ hữu ích cho thế giới thực!”

Stargate và cuộc chạy đua hạ tầng trung tâm dữ liệu
Stargate chỉ là ví dụ mới nhất trong cuộc chạy đua vũ trang về hạ tầng trung tâm dữ liệu tại Mỹ khi quốc gia này chuẩn bị cho giai đoạn bùng nổ kinh tế AI tiếp theo. Năm ngoái, xAI của Musk đã xây dựng siêu máy tính “Colossus” chứa 100.000 chip Nvidia được kết nối với nhau chỉ trong 3 tháng và cam kết sẽ mở rộng quy mô lên gấp 10 lần.

BlackRock và Microsoft đang chuẩn bị ra mắt quỹ đầu tư AI trị giá 30 tỷ USD để xây dựng trung tâm dữ liệu và các dự án năng lượng nhằm đáp ứng nhu cầu ngày càng tăng từ ngành công nghệ. Vào thứ Sáu, giám đốc điều hành Meta, Mark Zuckerberg, cho biết công ty sẽ chi từ 60 tỷ USD đến 65 tỷ USD vào cơ sở hạ tầng vốn trong năm nay, đồng thời mở rộng các nhóm AI của mình.

“Tôi đã có các cuộc họp liên tục với khách hàng, trong mọi lĩnh vực. Tôi không nghĩ có giám đốc điều hành nào tôi từng nói chuyện mà không nhận ra họ cần triển khai AI,” Friar từ OpenAI nói. “AI không còn chỉ là một khái niệm trừu tượng hay tầm nhìn tương lai. Nó đã ở đây. AI không chỉ nằm trong chương trình nghị sự; nó chính là chương trình nghị sự.”

AI leaders clash over safety and $100bn Stargate project
Top tech leaders at Davos such as DeepMind’s Demis Hassabis and Meta’s Yann LeCun in fiery debate

The biggest figures in artificial intelligence sparred over the dangers of the rapidly advancing technology at the World Economic Forum this week, as hype swirled around a $500bn AI infrastructure project touted by Donald Trump.
AI pioneers including Google DeepMind chief Sir Demis Hassabis, Anthropic co-founder Dario Amodei and “godfather of AI” computer scientist Yoshua Bengio used the gathering in Davos to reiterate stark warnings about the AI threats, as commercial interests and geopolitical rivalries steamroller concerns about safety.
While Hassabis acknowledged that the “genie can’t be put back in the bottle”, he said artificial general intelligence — when computers surpass human cognitive capabilities — could threaten civilisation if it runs out of control or is hijacked by bad actors. This is particularly the case with large language models that are “open source” and accessible by all.
“There’s much more at stake here than just companies or products,” the Nobel Prize winner said in an interview with the Financial Times. “[It’s] the future of humanity, the human condition and where we want to go as a society.”
Amodei, whose start-up makes the chatbot Claude and is backed by Google and Amazon, said he was concerned about authoritarian governments using AI and was “very worried about 1984 scenarios, or worse”.
“Science doesn’t know how we can control machines that are even at our level of intelligence, and even worse if they’re smarter than us,” added Bengio during a panel. “There are people who are saying, ‘Don’t worry, we’ll figure it out.’ But if we don’t figure it out, do you understand the consequences?”
Their stance was criticised as hypocritical by Yann LeCun, chief AI scientist at Meta, which has spent billions developing an open source LLM called Llama. He said that such concerns were belied by his rivals’ fierce competition to build, and sell, the best models.

“Yoshua and Dario have made opinions against open source and that’s actually very dangerous,” he said in an interview. “Obstacles to open source distribution would lead to regulatory capture by a few players, either of the west coast of the US or China . . . [putting] power in the hands of a small number of people.
“It’s very strange from people like Dario. We met yesterday where he said that the benefits and risks of AI are roughly on the same order of magnitude, and I said, ‘if you really believe this, why do you keep working on AI?’” LeCun added. “So I think he is a little two-faced on this.”
Whilst scientists and engineers debated the risk-reward of AI, business executives showed unfettered enthusiasm for the technology.
“There are no contrarians,” said Ervin Tu, president of Dutch tech investment group Prosus. “If you have any appreciation for what large language models and agents trained on them can do, you would be hard-pressed as a human not to conclude that they are transformational and will be incredibly disruptive in every industry.”
On Wednesday, the febrile atmosphere was further charged by OpenAI, SoftBank and Oracle announcing a $500bn US AI infrastructure joint venture called “Stargate”.
Trump hosted their chief executives, Sam Altman, Masayoshi Son and Larry Ellison, in the Oval Office on Tuesday, before signing executive orders this week that would eliminate many guardrails around the development of the technology. The new US president said the moves would ensure American primacy in the technology.

“At OpenAI, we believe infrastructure is destiny,” said OpenAI chief financial officer Sarah Friar. “[Stargate] is about more compute. More compute builds better models. Better models answer more complex problems and deliver more benefits for people and businesses.”
Stargate dominated debate in Davos for the rest of the week, with many including Elon Musk taking to his social networking site X to question how the trio would fund the vast expenditure promised.
The FT reported on Friday that Stargate has not yet secured the funding it requires, will receive no government financing and will serve only OpenAI once completed. So far, SoftBank and OpenAI intend to put forward more than $15bn each for the project, hoping to raise a combination of equity from their existing backers and debt to fund Stargate.

The new venture was also taken as the latest evidence of a fissure in the relationship between Altman and Microsoft chief executive Satya Nadella and his top AI executive Mustafa Suleyman, the former DeepMind cofounder who left his own startup and joined Microsoft early last year.
“The tensions that surfaced between Mustafa Suleyman and Sam Altman at Davos last year were just the beginning,” said Salesforce chief executive Marc Benioff, which competes with Microsoft in selling AI-powered agents to businesses.
“Microsoft is now accelerating its own AI development . . . This pattern reflects Microsoft’s history with its ‘partners,’” Benioff added. “This could mark the beginning of the end for the relationship, making it critical for OpenAI to expand to other platforms quickly.”
“Marc has no idea what he’s talking about,” said Microsoft spokesperson Frank Shaw.

Microsoft has invested almost $14bn in OpenAI since 2019 and in return negotiated rights to its intellectual property and to be its exclusive cloud computing provider. But the latter agreement was terminated alongside the announcement of Stargate.
In Davos, Nadella also cast doubt on the Stargate spending pledges and touted Microsoft’s planned $80bn in capital expenditure.

“All I know is I’m good for my $80bn,” he said, later replying to Musk on social media platform X: “And all this money is not about hyping AI, but is about building useful things for the real world!”

Stargate is just the latest example of an infrastructure arms race for data centres in the US as it prepares for the next leg of the AI economic boom. Musk’s xAI built a supercomputer called “Colossus” containing 100,000 interconnected Nvidia chips in just three months last year and has pledged to expand the number 10-fold.
BlackRock and Microsoft are preparing to launch a $30bn AI investment fund to build data centres and energy projects to meet growing demands stemming from the tech sector. On Friday, Meta chief Mark Zuckerberg said the company would spend between $60bn-$65bn on capital infrastructure this year while expanding its AI teams.
“I’ve had nonstop customer meetings, across every sector. I don’t think there’s a single CEO I’ve spoken to who doesn’t know they need to be deploying AI,” said OpenAI’s Friar. “AI isn’t just on the agenda; it is the agenda. It is no longer just an abstract concept or futuristic vision. It’s here.”

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-01-24 20:26:13

NVIDIA GeForce RTX 5080 đã bắt đầu được bán tại Việt Nam trước ngày ra mắt chính thức, nhưng thiếu driver

- Một người chơi game tại Việt Nam đã mua được card đồ họa NVIDIA GeForce RTX 5080 hơn một tuần trước ngày ra mắt chính thức

- Card được bán là model Colorful RTX 5080 iGame Ultra, một phiên bản không được phân phối tại tất cả các quốc gia

- Giá bán tại Việt Nam khoảng 1.400 USD, cao hơn 400 USD so với giá niêm yết tại Mỹ

- Người mua đã chia sẻ thông tin về việc sở hữu card trên Reddit với tên người dùng talama191

- RTX 5080 là lựa chọn tốt thứ hai tại thị trường Việt Nam do không thể mua được RTX 5090 Founders Edition

- Thị trường GPU tại Việt Nam từng có tiền lệ bán card đồ họa trước ngày ra mắt và bán cho các dàn đào tiền ảo trong thời điểm khan hiếm

- NVIDIA không có động thái ngăn chặn việc vi phạm lệnh cấm bán hàng trước ngày ra mắt tại châu Á

- Hiện tại card không thể hoạt động bình thường do NVIDIA chưa phát hành driver công khai cho RTX 5090/5080

- Người dùng phải đợi thêm một tuần nữa mới có thể sử dụng card để chơi game, trừ khi có được driver từ các thành viên báo chí

📌 Card đồ họa RTX 5080 xuất hiện sớm tại Việt Nam với giá 1.400 USD, cao hơn 400 USD so với giá niêm yết tại Mỹ. Tuy nhiên, thiếu driver khiến card chưa thể sử dụng cho gaming trong ít nhất một tuần tới.

https://videocardz.com/newz/nvidia-geforce-rtx-5080-already-on-sale-in-vietnam-drivers-missing

Không có file đính kèm.

Nguồn tham khảo

109

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-01-24 20:05:10

Dự án AI khổng lồ 500 tỷ USD Stargate chỉ phục vụ riêng OpenAI

- Dự án hạ tầng AI Stargate sẽ phục vụ độc quyền cho OpenAI, với kế hoạch đầu tư ban đầu 100 tỷ USD và có thể tăng lên 500 tỷ USD trong 4 năm tới

- Các đối tác sáng lập chính gồm OpenAI, SoftBank, Oracle và quỹ AI nhà nước Abu Dhabi MGX

- Donald Trump đã ca ngợi sáng kiến này tại sự kiện Nhà Trắng với sự tham dự của CEO OpenAI Sam Altman

- OpenAI và SoftBank dự kiến đóng góp mỗi bên hơn 15 tỷ USD cho dự án

- Microsoft không cung cấp vốn nhưng sẽ hỗ trợ kỹ thuật cho Stargate, dù đã đầu tư 13 tỷ USD vào OpenAI

- Microsoft riêng rẽ sẽ chi 80 tỷ USD cho cơ sở hạ tầng trong năm nay

- SoftBank đã đầu tư vào vòng gọi vốn 6,6 tỷ USD của OpenAI vào tháng 10/2023, định giá startup này ở mức 157 tỷ USD

- Stargate được thành lập tại Delaware, chia thành 2 đơn vị:
+ Đơn vị vận hành: xây dựng và điều hành trung tâm dữ liệu do OpenAI đứng đầu
+ Đơn vị huy động vốn: do SoftBank điều hành

- Cơ sở đầu tiên đang được xây dựng tại Abilene, Texas với sự tham gia của startup Crusoe

📌 Dự án hạ tầng AI Stargate trị giá lên tới 500 tỷ USD trong 4 năm tới sẽ độc quyền phục vụ OpenAI, với sự hợp tác từ SoftBank và Oracle. Dự án đã khởi công cơ sở đầu tiên tại Texas nhưng vẫn chưa hoàn thiện kế hoạch tài chính và cấu trúc.

https://www.ft.com/content/4541c07b-f5d8-40bd-b83c-12c0fd662bd9

#FT

Dự án trí tuệ nhân tạo Stargate phục vụ độc quyền OpenAI
Donald Trump đã gọi liên doanh do SoftBank hậu thuẫn là "tuyên bố mạnh mẽ về niềm tin vào tiềm năng của nước Mỹ"
George Hammond và Tabby Kinder tại San Francisco, Madhumita Murgia tại London, 9 giờ trước

Stargate, một dự án hạ tầng trí tuệ nhân tạo được Donald Trump giới thiệu rầm rộ trong tuần này, sẽ phục vụ độc quyền nhà sản xuất ChatGPT là OpenAI, theo nguồn tin thân cận với sự việc.

Liên doanh này dự kiến chi 100 tỷ USD cho các dự án hạ tầng công nghệ lớn, với con số này có thể tăng lên đến 500 tỷ USD trong 4 năm tới, theo OpenAI và SoftBank – 2 nhà tài trợ chính của Stargate – tuyên bố hôm thứ Ba. Oracle và quỹ AI MGX thuộc chính phủ Abu Dhabi cũng là các đối tác sáng lập.

Trump đã ca ngợi sáng kiến được SoftBank hậu thuẫn này vào thứ Ba tại một sự kiện tại Nhà Trắng, nơi có sự tham dự của giám đốc điều hành OpenAI Sam Altman và các lãnh đạo công nghệ khác, gọi đây là "một tuyên bố mạnh mẽ về niềm tin vào tiềm năng của nước Mỹ dưới thời tổng thống mới."

Bất chấp thông báo hoành tráng, Stargate vẫn chưa đảm bảo được nguồn vốn cần thiết, sẽ không nhận bất kỳ khoản tài trợ nào từ chính phủ và chỉ phục vụ OpenAI sau khi hoàn thành, theo các nguồn tin quen thuộc với sáng kiến này cho biết.

"Mục tiêu không phải trở thành nhà cung cấp trung tâm dữ liệu cho thế giới, mà là dành cho OpenAI," một nguồn tin cho biết.

Một người khác gần gũi với dự án cho hay kế hoạch này vẫn còn xa mới được hoàn thiện: "Họ chưa xác định được cấu trúc, chưa xác định được nguồn tài chính, chưa có số tiền nào được cam kết."

SoftBank và OpenAI dự định mỗi bên sẽ đóng góp hơn 15 tỷ USD cho dự án. Các công ty này hy vọng huy động được một phần vốn cổ phần từ các nhà tài trợ hiện tại của họ và phần còn lại từ các khoản vay, sẽ được dùng để tài trợ cho Stargate. Theo một nguồn tin, SoftBank có trụ sở tại Tokyo cũng sẽ bơm các quỹ hiện có của mình vào Stargate.

OpenAI và SoftBank từ chối bình luận.

Altman đã dành hơn 1 năm qua để tập trung tăng cường quyền truy cập vào dữ liệu và sức mạnh tính toán cho OpenAI – một nút thắt cổ chai mà ông cho rằng cần phải vượt qua nếu công ty muốn đạt được mục tiêu tạo ra AI có khả năng vượt qua con người trong hầu hết các kỹ năng nhận thức, thay thế họ trong lực lượng lao động và thúc đẩy ranh giới của nghiên cứu khoa học.

Điều đó có nghĩa là phải vượt ra ngoài mối quan hệ độc quyền của OpenAI với Microsoft. Tập đoàn này, đã đầu tư 13 tỷ USD vào OpenAI và được hưởng gần một nửa lợi nhuận từ công ty con hoạt động vì lợi nhuận của start-up này, đang cung cấp hỗ trợ công nghệ cho Stargate nhưng không đóng góp vốn.

Microsoft đã ra mắt quỹ hạ tầng AI trị giá 30 tỷ USD cùng với nhà quản lý quỹ BlackRock vào tháng 9 năm ngoái, và hôm thứ Tư, giám đốc điều hành Satya Nadella tuyên bố công ty sẽ chi 80 tỷ USD cho hạ tầng trong năm nay, tách biệt với Stargate.

Altman đã thảo luận với chủ tịch SoftBank Masayoshi Son trong khoảng 2 năm về các dự án AI, bao gồm cả một thiết bị AI mới, theo những người quen thuộc với các cuộc thảo luận.

SoftBank cũng đã đầu tư vào OpenAI trong vòng gọi vốn trị giá 6,6 tỷ USD vào tháng 10, định giá start-up này ở mức 157 tỷ USD. Financial Times đưa tin tập đoàn Nhật Bản này có kế hoạch mua thêm 1,5 tỷ USD cổ phần của công ty vào tháng 11. Theo 2 nguồn tin trực tiếp, Son và Altman đã bắt đầu thảo luận chi tiết về Stargate vài tháng trước khi thông báo trong tuần này.

Mặc dù các kế hoạch hạ tầng của Altman đã được chuẩn bị hơn 1 năm, “ý tưởng công bố nó tại Nhà Trắng không phải là điều được chuẩn bị [lâu như vậy],” theo một người am hiểu về dự án.

“Có một ý định thực sự để thực hiện điều này, nhưng các chi tiết vẫn chưa được hoàn thiện,” một người khác tham gia vào dự án cho biết. “Mọi người muốn làm những điều hoành tráng ngay trong tuần đầu tiên Trump nhậm chức.”

Stargate được thành lập tại Delaware, với OpenAI, SoftBank, Oracle và MGX mỗi bên đều nắm cổ phần trong công ty. Nhóm này sẽ bổ nhiệm một giám đốc điều hành độc lập và hội đồng quản trị, theo những người nắm thông tin về kế hoạch.

Công ty sẽ được chia thành 2 đơn vị: một đơn vị vận hành chịu trách nhiệm xây dựng và vận hành các trung tâm dữ liệu, do OpenAI đứng đầu, và một đơn vị chịu trách nhiệm huy động vốn, do SoftBank quản lý, một người am hiểu về dự án tiết lộ.

Công việc đã bắt đầu tại cơ sở đầu tiên ở Abilene, Texas.

Công ty khởi nghiệp trung tâm dữ liệu Crusoe đã xây dựng cơ sở này cho Oracle từ tháng 6 năm 2023. Crusoe đã nhận được khoản tài trợ 3,4 tỷ USD từ Blue Owl vào tháng 10 để hỗ trợ phát triển dự án. Oracle dự kiến sẽ mua khoảng 7 tỷ USD chip để cung cấp năng lượng cho cơ sở tại Texas và sẽ cung cấp sức mạnh tính toán đó cho Microsoft, công ty sẽ sử dụng nó để hỗ trợ OpenAI.

Stargate artificial intelligence project to exclusively serve OpenAI
Donald Trump has called the SoftBank-backed venture a ‘resounding declaration of confidence in America’s potential’
George Hammond and Tabby Kinder in San Francisco and Madhumita Murgia in London 9 hours ago
Stargate, a high-profile artificial intelligence infrastructure project trumpeted by Donald Trump this week, will exclusively serve ChatGPT maker OpenAI, according to people familiar with the matter.
The venture planned to spend $100bn on Big Tech infrastructure projects, with the figure rising to as much as $500bn over the next four years, OpenAI and SoftBank, Stargate’s two main backers, said on Tuesday. Oracle and Abu Dhabi state AI fund MGX are also founding partners.
Trump lauded the SoftBank-backed initiative on Tuesday at a White House event attended by OpenAI chief Sam Altman and other tech executives as “a resounding declaration of confidence in America’s potential under a new president.”
Despite the flashy announcement, Stargate has not yet secured the funding it requires, will receive no government financing and will only serve OpenAI once completed, the people familiar with the initiative have said.
“The intent is not to become a data centre provider for the world, it’s for OpenAI,” said one of the people.
Another person close to the project said it was far from a fully developed plan: “They haven’t figured out the structure, they haven’t figured out the financing, they don’t have the money committed.”
SoftBank and OpenAI intend to put forward more than $15bn each for the project. The companies hope to raise a combination of equity from their existing backers and debt, which will be used to fund Stargate. Tokyo-based SoftBank will also inject existing funds into Stargate, according to one of the people.
OpenAI and SoftBank declined to comment.
Altman has spent well over a year working on boosting OpenAI’s access to data and computing power, a bottleneck he argues must be overcome if the company is to achieve its goal of creating AI capable of surpassing humans across most cognitive skills, supplanting them in the workforce and pushing the boundaries of scientific research.
That has meant looking beyond OpenAI’s exclusive relationship with Microsoft. The group, which has invested $13bn into OpenAI and is entitled to almost half the profits from the start-up’s for-profit subsidiary, is providing technological support to Stargate, but not capital.

Microsoft launched its own $30bn AI infrastructure fund with fund manager BlackRock in September last year, and on Wednesday chief executive Satya Nadella said his company would spend $80bn on infrastructure this year, separate from Stargate.
Altman had been speaking to SoftBank chair Masayoshi Son for as long as two years about AI projects, including a new AI device, according to people familiar with the discussions.
SoftBank also invested in OpenAI during a $6.6bn fundraising round in October, which valued the start-up at $157bn, and the Financial Times reported the Japanese group planned to purchase an additional $1.5bn of stock in the company in November. Son and Altman began having detailed talks on Stargate in the months before this week’s announcement, according to two people with direct knowledge of the matter.
While Altman’s infrastructure plans had been in the works for well over a year, “the idea of announcing it at the White House was not in the works for [as long]”, according to one person with knowledge of the project.
“There’s a real intent to do this, but the details haven’t been fleshed out,” said another person involved in the project. “People want to do splashy things in the first week of Trump being in office.”
Stargate is incorporated in Delaware, with OpenAI, SoftBank, Oracle and MGX each taking stakes in the company. The group will appoint an independent chief executive and board, according to people with knowledge of the plans.
The company would be split into an operational unit, tasked with building and running the data centres and headed by OpenAI, and a unit responsible for raising capital, run by SoftBank, a person familiar with the project said.
Work is already under way on a first facility in Abilene, Texas.
Data centre start-up Crusoe has been building that facility for Oracle since June 2023. Crusoe secured $3.4bn in financing from Blue Owl in October to help fund its development. Oracle is expected to buy about $7bn worth of chips to power the Texas site and will provide that computing power to Microsoft, which will use it to power OpenAI.

Không có file đính kèm.

Nguồn tham khảo

107

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-01-24 16:57:54

Tỷ phú Mukesh Ambani và Reliance Group dự định xây dựng trung tâm dữ liệu lớn nhất thế giới tại Ấn Độ

- Tập đoàn Reliance của tỷ phú Mukesh Ambani đang xây dựng trung tâm dữ liệu có công suất 3 gigawatt tại thành phố Jamnagar, Ấn Độ

- Dự án có thể tiêu tốn từ 20-30 tỷ USD, lớn hơn nhiều so với các trung tâm dữ liệu hiện có trên thế giới (dưới 1 gigawatt)

- Microsoft hiện đang sở hữu trung tâm dữ liệu lớn nhất tại Boydton, Virginia với công suất gần 600 megawatt

- Reliance đang mua chip AI từ Nvidia và dự định cung cấp dịch vụ suy luận AI (inferencing) với giá rẻ nhất thế giới

- Jamnagar là thành phố có hơn 650.000 dân, nằm ở bang Gujarat - quê hương của Thủ tướng Narendra Modi

- Trung tâm dữ liệu sẽ được tích hợp với khu công nghiệp năng lượng xanh rộng hơn 2.000 hecta của Reliance, bao gồm các nhà máy pin mặt trời, pin nhiên liệu và turbine gió

- Theo McKinsey, nhu cầu về công suất trung tâm dữ liệu toàn cầu có thể tăng gấp 3 lần vào năm 2030, đạt 219 gigawatt mỗi năm

- Riêng tại Mỹ có thể thiếu hụt 15 gigawatt công suất vào năm 2030, cần mở rộng gấp đôi công suất hiện tại

- Tuần này, OpenAI, SoftBank và Oracle đã cam kết đầu tư 100-500 tỷ USD vào cơ sở hạ tầng AI tại Mỹ thông qua dự án Stargate

- Reliance Industries có khoảng 26 tỷ USD trong bảng cân đối kế toán để tài trợ cho dự án này

📌 Tỷ phú Ambani đang thực hiện bước đi táo bạo nhất trong lĩnh vực trung tâm dữ liệu toàn cầu với dự án 3 gigawatt trị giá 30 tỷ USD tại Ấn Độ, gấp 5 lần quy mô hiện tại của Microsoft, nhằm thống lĩnh thị trường dịch vụ AI với chiến lược giá thấp.

https://www.bloomberg.com/news/articles/2025-01-23/billionaire-mukesh-ambani-plans-world-s-biggest-data-center-in-india-s-gujarat

Billionaire Ambani Plans World’s Biggest Data Center in India

Reliance joins rush of tech companies building data centers
Ambani plans aggressive pricing in offering AI services

By Saritha Rai

January 23, 2025 at 10:00 PM UTC

Mukesh Ambani’s Reliance Group is building what may become the world’s biggest data center by capacity in India, the latest in a blitz of global investments to capitalize on booming demand for artificial intelligence services.

The 67-year-old billionaire is buying Nvidia Corp.’s powerful AI semiconductors and setting up a data center in the town of Jamnagar that’s expected to have a total capacity of three gigawatts, according to people familiar with the matter, who asked not to be identified because the details aren’t public. That would make it far bigger than any data center now operating.

Ambani is joining a growing cohort of tech companies including Microsoft Corp., Alphabet Inc. and Amazon.com Inc. that are pouring billions of dollars into data centers to deliver AI capabilities to customers worldwide. This week, OpenAI, SoftBank Group Corp. and Oracle Corp. pledged to invest $100 billion to $500 billion in AI infrastructure in the US through a new entity called Stargate Project.

Still, Ambani’s project, if it goes ahead as envisioned, stands out for its sheer size. The largest data centers operating now are less than 1 gigawatt, according to data provided by market intelligence firm DC Byte, which would make his several times larger than what’s on the market.

Data center capacity is often measured in the megawatts (millions of watts) of electricity that the site can feed into servers, cooling systems and other equipment. The larger the figure, the higher the volume of computing operations it can support. And AI models are notoriously compute-intensive.

Ambani built his reputation with aggressive business tactics, including a ruthless rush into the wireless business that sent prices plummeting and put several rivals out of business. His playbook seems similar in AI and he has said he will offer rock-bottom rates for what’s known as inferencing, or operating models like the ones that power ChatGPT. Inferencing costs can be onerous for companies like OpenAI and local startups because they have to pay for computing resources every time a user has a query.

Reliance executives did not respond to multiple queries seeking comment.

It’s not clear how Ambani would pay for the project, which could cost $20 billion to $30 billion based on expenses in the region for such facilities. Reliance Industries Ltd., the group’s primary listed entity, has the equivalent of about $26 billion on its balance sheet.

The Jamnagar facility would substantially boost India’s data center capacity, now estimated at less than 1 gigawatt. Tripling that size would give the world’s most populous country the potential to greatly accelerate its development of artificial intelligence.

Jamnagar, a town of more than 650,000 people, is located in Prime Minister Narendra Modi’s home state of Gujarat, and Ambani himself has familial roots in the state. It’s the hub of Reliance’s oil refining and petrochemicals complex, the world’s largest.

The town is becoming increasingly central to the conglomerate’s plans that include a push into renewable energy. Reliance has said it’s building a gigantic green energy complex spread over 5,000 acres with factories to make photo-voltaic panels, fuel cell systems, green hydrogen, energy storage and wind turbines.

Reliance aims to power the new data center as much as possible with renewable energy, said the people. It will abut Reliance Group projects under way that will produce solar, wind and green hydrogen energy, according to one of the people.

It’s virtually impossible, however, to supply a continuous and dependable stream of solar and wind power without more consistent resources such as nuclear reactors, fossil fuel-fired plants or extraordinarily large battery systems to back it up. Reliance, whose roots lie in petroleum products, may require fossil fuels to back up its data centers.

The world’s biggest data centers by capacity are now all located in the US and owned by tech giants. Microsoft’s facility in Boydton, Virginia, is the largest with capacity of almost 600 megawatts and another 112 megawatts under construction, followed by Google and Meta Platforms Inc. operations, according to DC Byte.

OpenAI, SoftBank and Oracle didn’t specify the size of the data centers they would build as part of the Stargate effort. Sam Altman, chief executive officer of OpenAI, has floated the idea of building 5-gigawatt facilities but it’s unclear whether they’re in the works.

Ambani has previously spoken about his plans to drive down pricing in AI.

“By leveraging our expertise in infrastructure, networking, operations, software, and data and by collaborating with our global partners, our goal is to create the world’s lowest AI inferencing cost, right here in India,” Ambani said last year at the company’s annual shareholders’ meeting. “This will make AI applications in India more affordable than anywhere else, making AI accessible to all.”

Demand for data centers equipped to host AI workloads is forecast to soar with the emergence of generative AI, the type of AI that generates content based on prompts - such as OpenAI’s ChatGPT. Experts are forecasting a looming capacity crunch as businesses adopt chatbots and generative AI tools to streamline work and boost productivity.

Global demand for data center capacity could more than triple by 2030 to reach an annual level of 219 gigawatts, according to consultancy McKinsey & Co. A potentially significant supply deficit is building up, with the US alone likely to face a shortfall of 15 gigawatts of capacity by 2030, the consultancy said, requiring an expansion of at least twice the data center capacity built since 2000.

Không có file đính kèm.

Nguồn tham khảo

158

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-01-24 16:11:05

Chiến lược thông minh của Oracle: Đầu tư 500 tỷ USD vào AI cùng OpenAI dù nguồn lực khiêm tốn

- Oracle được chọn làm đối tác công nghệ chính và nhà đầu tư cho dự án Stargate của OpenAI, với tổng vốn đầu tư 500 tỷ USD trong 4 năm tới.

- Dự án đã khởi công xây dựng trung tâm dữ liệu đầu tiên tại Texas, với 100 tỷ USD được triển khai ngay lập tức - gấp đôi tổng tiền mặt hiện có của Oracle và Softbank cộng lại.

- Chi tiêu vốn hàng năm của Oracle cho AI đã tăng lên gần 11 tỷ USD, so với mức trung bình 5,5 tỷ USD trong 4 năm tài chính trước.

- Giá cổ phiếu Oracle đã tăng 14% trong 2 ngày sau khi thông tin về Stargate được công bố.

- Oracle có vốn hóa thị trường 500 tỷ USD, là công ty công nghệ lớn nhất trong S&P 500 chưa đạt mức 1.000 tỷ USD.

- Tổng chi tiêu vốn của Oracle chỉ bằng một phần nhỏ so với 236,5 tỷ USD mà Microsoft, Amazon, Google và Meta dự kiến chi trong năm 2024.

- Dòng tiền tự do hàng năm của Oracle đạt 9,5 tỷ USD (tính đến tháng 11), trong khi Microsoft ước tính đạt hơn 70 tỷ USD năm ngoái.

- Oracle áp dụng chiến lược thuê mặt bằng trung tâm dữ liệu thay vì mua, cấu hình thiết bị để tối ưu hiệu suất và tiết kiệm không gian.

- Cổ phiếu Oracle hiện được giao dịch ở mức P/E trên 28 lần - mức cao nhất kể từ thời kỳ bong bóng dot-com.

📌 Oracle đã chứng tỏ tầm nhìn chiến lược khi tham gia dự án Stargate 500 tỷ USD cùng OpenAI. Dù nguồn lực tài chính khiêm tốn hơn các đối thủ lớn, công ty vẫn tạo được lợi thế cạnh tranh nhờ cách tiếp cận linh hoạt trong việc xây dựng và vận hành trung tâm dữ liệu.

https://www.wsj.com/tech/ai/how-oracle-plays-cheaply-in-ai-30d84030

#WSJ

How Oracle Plays Cheaply in AI

Software company has less spending power than other megacap techs, but partnerships and its data-center design give it flexibility

Dan Gallagher

Jan. 23, 2025 5:30 am ET

Oracle founder and Chairman Larry Ellison at the AI announcement Tuesday with President Trump.

When it comes to big techs, Oracle is hardly small-fry. But the 47-year-old software titan still has to play its hand deftly when it comes to the ultra-expensive game of artificial intelligence.

Its approach was apparent in the high-profile announcement about the “Stargate Project,” which aims to invest $500 billion over the next four years to build new AI infrastructure for OpenAI. Oracle was named as both an equity investor and “key initial technology partner” for the project, and founder and Chairman Larry Ellison joined OpenAI’s Sam Altman and SoftBank Chief Executive Masayoshi Son Tuesday at the White House for the announcement.

Ellison noted Tuesday that construction on the initial data center for the project was already under way in Texas. Less clear is where such a staggering sum of money will be coming from. OpenAI said $100 billion was being deployed immediately, but that is more than double Oracle and Softbank’s combined total cash on hand. Elon Musk, backer of his own AI project, used his X social-media platform to cast doubts about the financial backing for Stargate. Oracle has already ratcheted up its capital expenditures on AI significantly, with annual total capex now nearing $11 billion annually compared with an average of $5.5 billion over the last four fiscal years.

Oracle’s share price has jumped 14% over the last two days since Stargate was first reported, so Wall Street doesn’t seem terribly worried about who is footing the bill at this point. Analysts instead noted that Oracle’s prominent Stargate role solidifies the position of its cloud unit known as OCI as an important force in powering generative AI workloads.

“We believe this is a win for Oracle, if for no other reason than further cementing OCI’s relevance in the future of AI,” wrote Brad Zelnick of Deutsche Bank. “Clearly, the fundamental impact from Stargate remains to be seen, but the announcement is a reminder that Oracle is well positioned to be a major player in the build out of AI infrastructure,” wrote Kirk Materne of Evercore ISI.

Still, while Oracle’s $500 billion market cap makes it the largest tech company on the S&P 500 not valued above $1 trillion, it still has to compete with bigger players with much more spending power. Even the company’s recently raised capex bill is a fraction of the $236.5 billion Microsoft, Amazon, Google-parent Alphabet and Meta Platforms are estimated to have spent combined in 2024, according to Visible Alpha. Oracle is the only one of those five whose debt exceeds its total cash, and its annual free cash flow totaled $9.5 billion for the 12-month period ended November. Rival Microsoft is estimated to have generated a little over $70 billion in free cash flow last year, according to consensus analyst figures on FactSet.

Analysts say Oracle’s unique approach to data centers allows it to compete effectively with much deeper pockets. Mark Moerdler of Bernstein says the company rents a lot of its data-center real estate instead of buying and that it and configures its equipment to make those spaces smaller and boost its performance efficiency. In a report last month, Moerdler noted that “the smaller footprints enables Oracle to more closely match their capex with customer’s consumption and thus revenue, as they can expand as customers need it.” He estimated that Oracle’s approach allows it to devote a much greater portion of its capex to acquiring computing equipment relative to the much bigger spender Microsoft.

Oracle has already projected strong growth for the years ahead. Its stock is now fetching a multiple of more than 28 times projected earnings—a level last seen in the original dot-com boom. But that is still cheap relative to its biggest cloud rivals Microsoft and Amazon, and for a company that is in a prime position with the new administration. President Trump even used Tuesday’s occasion to voice support for the idea of Ellison buying TikTok. Getting a growing piece of the AI pie, however, is what will really keep Oracle’s investors dancing.

Write to Dan Gallagher at [email protected]

Không có file đính kèm.

Nguồn tham khảo

161

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-01-23 17:38:54

Kế hoạch AI trị giá 500 tỷ USD của Trump là 'cái tát' vào mặt châu Âu

Dự án Stargate của Mỹ:
Tổng thống Trump công bố dự án Stargate trị giá 500 tỷ USD, dự kiến triển khai ngay khoản đầu tư ban đầu 100 tỷ USD để xây dựng cơ sở hạ tầng AI tại Mỹ, khởi điểm là trung tâm dữ liệu ở Texas. Dự án dự kiến tạo hơn 100.000 việc làm và đặt nền móng cho sự thống trị công nghệ AI của Mỹ.
Phản ứng từ châu Âu:
Các nhà lãnh đạo EU coi đây là một "cái tát" đối với tham vọng AI của châu Âu, đặc biệt khi các khoản đầu tư của EU vào AI chỉ đạt khoảng 1,5 tỷ EUR (50% từ ngân sách EU). So với quy mô của Stargate, châu Âu bị đánh giá là thiếu tham vọng và thiếu các công ty công nghệ lớn để huy động vốn tư nhân như Mỹ.
Hạn chế của EU:
- Hạ tầng tài chính phân mảnh: Các thị trường tài chính châu Âu chưa đủ mạnh để hỗ trợ startup huy động vốn lớn.
- Chi phí năng lượng cao: Chi phí năng lượng tại châu Âu tăng cao sau chiến tranh Ukraine, gây khó khăn trong việc vận hành trung tâm dữ liệu, trong khi Mỹ có chính sách tăng cường khai thác năng lượng.
- Thiếu công ty dẫn đầu: Châu Âu không có các công ty AI tầm cỡ như OpenAI, NVIDIA hay Microsoft để thu hút vốn và công nghệ.
Chiến lược AI của châu Âu:
- EU đã chọn 7 địa điểm để phát triển siêu máy tính tối ưu hóa AI, nhưng quy mô đầu tư quá nhỏ so với Mỹ.
- Các chính sách mới như "la bàn cạnh tranh" và "mã doanh nghiệp chung" được kỳ vọng sẽ cải thiện môi trường đầu tư, nhưng khó đạt mức tham vọng như Stargate.
Thách thức địa chính trị:
- Dự án Stargate củng cố vị thế Mỹ trong cuộc cạnh tranh AI toàn cầu, đặc biệt trước sự trỗi dậy của Trung Quốc.
- Sự độc quyền của công nghệ AI Mỹ có thể khiến các quốc gia khác mất chủ quyền công nghệ và phụ thuộc vào Mỹ về các ứng dụng AI quan trọng.
Cảnh báo từ chuyên gia:
Nhiều chuyên gia cho rằng châu Âu nên tập trung vào các dự án nhỏ và thực tế hơn thay vì cố gắng cạnh tranh trực tiếp với Mỹ, đồng thời thu hút đầu tư tư nhân để thu hẹp khoảng cách.

📌 Stargate đánh dấu sự thống trị của Mỹ trong cuộc đua AI, đặt châu Âu vào thế yếu với các khoản đầu tư hạn chế và chi phí năng lượng cao. Để bắt kịp, EU cần cải cách mạnh mẽ tài chính và đầu tư vào các dự án AI thực tế.

https://www.politico.eu/article/us-500-ai-europe-donald-trump-global-leadership-eu-social-media-china/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-01-23 17:30:43

Cuộc gọi giữa Donald Trump và Sam Altman (OpenAI) trước khi công bố Stargate

- Donald Trump đã có cuộc gọi quan trọng với CEO OpenAI, Sam Altman, vào thứ Sáu trước khi công bố kế hoạch cơ sở hạ tầng AI tại Mỹ, nhấn mạnh mục tiêu xây dựng công nghệ AI nội địa thay vì phụ thuộc vào Trung Quốc. Trump kỳ vọng điều này sẽ tạo việc làm và tăng niềm tin kinh tế.
- Ngay sau lễ nhậm chức, Trump nhanh chóng tiết lộ dự án "Stargate" – liên doanh giữa OpenAI, Oracle và SoftBank, cam kết đầu tư 500 tỷ USD cung cấp cơ sở hạ tầng AI tại Mỹ.
- Elon Musk, người từng là đồng sáng lập OpenAI và hiện đứng đầu hội đồng tư vấn chính phủ của Trump, công khai phản đối dự án Stargate, cho rằng các công ty liên quan không có đủ tài chính đảm bảo cam kết. Ông cũng chỉ trích SoftBank chỉ có “dưới 10 tỷ USD” được đảm bảo.
- Musk hiện đang kiện OpenAI để ngăn họ chuyển đổi thành công ty vì lợi nhuận, trong khi Altman công bố email khẳng định Musk trước đây đã đề xuất việc này. Tranh chấp pháp lý và những chỉ trích công khai giữa hai bên đang ngày càng căng thẳng.
- Microsoft, đơn vị tài trợ chính cho OpenAI, thông báo sẽ chi 80 tỷ USD vào các trung tâm dữ liệu tích hợp AI trong năm nay. CEO Microsoft, Satya Nadella, khẳng định họ có đủ tài chính để đầu tư.
- Altman vẫn giữ mối quan hệ tốt với Larry Ellison (Oracle) và Masayoshi Son (SoftBank), cả hai đều là đồng minh thân cận của Trump. SoftBank tuyên bố đầu tư 100 tỷ USD vào Mỹ nhằm hỗ trợ dự án Stargate, trong khi Oracle đạt thỏa thuận hợp tác đám mây với OpenAI từ tháng 6.

---

📌 Trump đã gọi điện trao đổi dài với Sam Altman về tương lai AI, dẫn đến kế hoạch Stargate trị giá 500 tỷ USD. Tuy nhiên, dự án này bị Elon Musk công khai chỉ trích về tài chính. Microsoft, SoftBank và Oracle đang tham gia, nhưng tranh chấp pháp lý giữa Altman và Musk ngày càng gay gắt.

https://www.cnbc.com/2025/01/22/trump-had-phone-call-with-openais-sam-altman-last-week.html

Không có file đính kèm.

Nguồn tham khảo

100

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-01-23 17:19:51

Stargate: Canh bạc 500 tỷ USD của OpenAI và cuộc đua sống còn Mỹ-Trung về AI

- Dự án Stargate được công bố với tổng mức đầu tư 500 tỷ USD, trong đó có 100 tỷ USD là khoản đầu tư ban đầu từ OpenAI, SoftBank, Oracle và nhà đầu tư MGX đến từ UAE.
- CEO OpenAI, Sam Altman, gọi Stargate là "dự án quan trọng nhất của thời đại này." Dự án nhằm xây dựng các trung tâm dữ liệu khổng lồ tại Mỹ để hỗ trợ việc sử dụng AI đang tăng cao và phát triển trí tuệ nhân tạo tổng hợp (AGI).
- Quy mô dự án vượt xa các dự án công nghệ lớn trong lịch sử như Manhattan Project phát triển bom nguyên tử, với nhiều rủi ro vì AGI là công nghệ chưa có định nghĩa rõ ràng và không đảm bảo lợi nhuận.
- Ethan Mollick, giáo sư tại Đại học Pennsylvania, chỉ ra rằng chưa có tầm nhìn rõ ràng về cách AGI sẽ thay đổi cuộc sống hàng ngày trong 5-10 năm tới.
- Dự án Stargate đặt mục tiêu tạo ra 100.000 việc làm, thúc đẩy kinh tế và duy trì vị thế dẫn đầu của Mỹ trước Trung Quốc trong cuộc đua về AI. Tổng thống Donald Trump gọi đây là "kỷ nguyên vàng mới," trong khi Larry Ellison từ Oracle gợi ý rằng dự án có thể đem lại đột phá trong điều trị ung thư.
- Tuy nhiên, nhiều nhà phê bình lo ngại về nguy cơ chi phí lớn nhưng không mang lại kết quả, tương tự các dự án AI thất bại trước đây như xe tự lái. Gary Marcus cho rằng tiềm năng AI đã bị thổi phồng quá mức, và việc tập trung nguồn lực vào AGI bỏ qua các cuộc khủng hoảng khác cần được giải quyết ngay.
- Cạnh tranh quốc tế gia tăng sau khi startup Trung Quốc DeepSeek ra mắt mô hình AI nguồn mở có kết quả vượt OpenAI trong các bài thử nghiệm về toán học và tư duy. Điều này khiến các chuyên gia lo ngại về thế cân bằng quyền lực toàn cầu trong AI.
- Trump đã hủy bỏ các chính sách kiểm soát AI của chính quyền Biden, nhằm giảm rào cản và đẩy mạnh đổi mới AI trong môi trường kinh doanh thân thiện. Tuy nhiên, quyết định này có thể tăng thêm rủi ro về mặt đạo đức và xã hội.
- Các chuyên gia cảnh báo rằng khi Big Tech đẩy mạnh phát triển AGI mà không chuẩn bị trước cho xã hội, các rủi ro như tự động hóa không kiểm soát và biến đổi kinh tế có thể rất nghiêm trọng.

---

📌 Dự án Stargate của OpenAI là canh bạc công nghệ lớn với mức đầu tư 500 tỷ USD và mục tiêu phát triển AGI. Dự án hứa hẹn tạo ra 100.000 việc làm và củng cố vị thế Mỹ, nhưng đối mặt với rủi ro cao và sự cạnh tranh khốc liệt từ Trung Quốc. Rủi ro xã hội và đạo đức cần được xem xét kỹ lưỡng.

https://fortune.com/2025/01/22/openai-stargate-ai-sam-altman-donald-trump/

Không có file đính kèm.

Nguồn tham khảo

134

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-01-23 07:11:50

Elon Musk và Sam Altman đấu khẩu nảy lửa về dự án AI khổng lồ Stargate

Elon Musk và CEO OpenAI, Sam Altman, đã có cuộc tranh cãi căng thẳng trên nền tảng mạng xã hội X xoay quanh dự án Stargate - dự án cơ sở hạ tầng AI trị giá 500 tỷ USD do OpenAI phát triển.

Stargate được công bố tại một cuộc họp báo ở Nhà Trắng, với sự góp vốn từ các nhà đầu tư lớn như SoftBank và quỹ MGX từ Trung Đông. Các đối tác hiện đã cam kết 100 tỷ USD, bao gồm cả chi phí xây dựng trung tâm dữ liệu tại Abilene, Texas.

Musk cáo buộc Stargate không thực sự có đủ nguồn vốn như tuyên bố, cho rằng SoftBank chỉ mới đảm bảo chưa đến 10 tỷ USD. Altman đã bác bỏ cáo buộc này, khẳng định rằng dự án có tiềm năng lớn cho sự phát triển quốc gia.

Dự án Stargate được thiết kế để hỗ trợ khối lượng công việc AI khổng lồ của OpenAI. Các trung tâm dữ liệu sẽ tiêu tốn hàng trăm tỷ USD để đảm bảo năng lực vận hành.

Musk, người đứng đầu công ty xAI, đang cạnh tranh trực tiếp với OpenAI và hiện kiện cáo OpenAI với cáo buộc thực hiện hành vi phản cạnh tranh, bao gồm việc cản trở các nhà đầu tư hỗ trợ các đối thủ.

Trong khi đó, xAI đã chi tới 12 tỷ USD để xây dựng một trung tâm dữ liệu riêng tại Memphis, với dự đoán sẽ cần thêm hàng tỷ USD để nâng cấp cơ sở hạ tầng.

Ngoài lĩnh vực AI, Musk còn lãnh đạo Ủy ban Tư vấn Hiệu quả Chính phủ Mỹ (DOGE), một sáng kiến do Tổng thống Donald Trump hậu thuẫn nhằm cắt giảm chi tiêu liên bang, nhưng hiện đối mặt với hàng loạt thách thức pháp lý.

CEO Microsoft, Satya Nadella, một đối tác lớn của OpenAI, từ chối bình luận về tranh cãi, chỉ nhấn mạnh rằng Microsoft đã cam kết đầu tư 80 tỷ USD cho các trung tâm dữ liệu AI.

📌 Cuộc tranh cãi giữa Elon Musk và Sam Altman xoay quanh dự án Stargate trị giá 500 tỷ USD đã làm nổi bật sự cạnh tranh trong ngành AI. Musk cáo buộc thiếu vốn, trong khi Altman khẳng định Stargate mang lại lợi ích quốc gia. Cả hai đều đang chạy đua xây dựng cơ sở hạ tầng AI khổng lồ, với các khoản đầu tư hàng chục tỷ USD từ Microsoft và các đối tác toàn cầu.

https://techcrunch.com/2025/01/22/elon-musk-and-sam-altman-take-to-social-media-to-fight-over-stargate/

Không có file đính kèm.

Nguồn tham khảo

105

AI chips-hardware-compute 2025-01-22 20:53:16

GPU-as-a-Service đang nổi lên như một giải pháp cho nhu cầu tính toán AI ngày càng tăng

- Nhu cầu sức mạnh tính toán cho AI đang tăng mạnh, đặc biệt là GPU do khả năng xử lý hiệu quả nhiều tác vụ đồng thời.

- Không phải startup AI nào cũng đủ vốn đầu tư vào số lượng lớn GPU cần thiết, dẫn đến sự xuất hiện của dịch vụ GPU-as-a-Service (GPUaaS).

- Các công ty như Hyperbolic, Kinesis, Runpod và Vast.ai cung cấp sức mạnh xử lý từ xa cho khách hàng.

- Kinesis phát hiện và tận dụng sức mạnh tính toán nhàn rỗi từ GPU và CPU trên các máy chủ toàn cầu, tổng hợp thành một nguồn tính toán duy nhất.

- Hơn 50% GPU hiện có không được sử dụng tại bất kỳ thời điểm nào, tạo ra cơ hội lớn cho GPUaaS.

- Kinesis hợp tác với đại học, trung tâm dữ liệu, công ty và cá nhân để mua lại sức mạnh tính toán không sử dụng.

- GPUaaS giúp tiết kiệm chi phí bằng cách loại bỏ nhu cầu mua và bảo trì cơ sở hạ tầng vật lý, cho phép công ty tập trung vào cải thiện mô hình AI.

- Các startup không cần máy chủ như Kinesis tuyên bố thân thiện với môi trường hơn bằng cách tận dụng đơn vị xử lý hiện có thay vì cấp nguồn cho máy chủ bổ sung.

- Quy mô thị trường GPUaaS đạt 3,23 tỷ USD vào năm 2023, tăng lên 4,31 tỷ USD năm 2024 và dự kiến đạt 49,84 tỷ USD vào năm 2032.

- Ngành công nghiệp AI đang chuyển trọng tâm từ xây dựng và đào tạo mô hình sang tối ưu hóa hiệu quả.

📌 GPU-as-a-Service đang bùng nổ, tận dụng 50% GPU nhàn rỗi để đáp ứng nhu cầu tính toán AI tăng vọt. Thị trường dự kiến đạt 49,84 tỷ USD vào 2032, mang lại giải pháp tiết kiệm chi phí và bền vững cho các startup AI.

https://spectrum.ieee.org/gpu-as-a-service

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-01-22 20:34:06

ByteDance, công ty mẹ của TikTok, lên kế hoạch đầu tư 12 tỷ USD vào chip AI trong năm 2025

- ByteDance, công ty sở hữu TikTok, dự định chi hơn 12 tỷ USD cho cơ sở hạ tầng AI trong năm 2025.

- Công ty có kế hoạch chi 40 tỷ nhân dân tệ (5,5 tỷ USD) để mua chip AI tại Trung Quốc, gấp đôi so với năm ngoái.

- Khoảng 6,8 tỷ USD sẽ được đầu tư ở nước ngoài để tăng cường khả năng đào tạo mô hình nền tảng sử dụng chip Nvidia tiên tiến.

- 60% đơn đặt hàng bán dẫn trong nước sẽ dành cho các nhà cung cấp Trung Quốc như Huawei và Cambricon, phần còn lại cho chip Nvidia đã được điều chỉnh để phù hợp với kiểm soát xuất khẩu của Mỹ.

- Bắc Kinh đã đưa ra hướng dẫn không chính thức yêu cầu các công ty công nghệ Trung Quốc mua ít nhất 30% chip từ các nhà cung cấp trong nước.

- ByteDance đang đối mặt với áp lực trong mảng kinh doanh mạng xã hội cốt lõi, với TikTok phải khôi phục dịch vụ cho 170 triệu người dùng Mỹ sau khi Tổng thống Donald Trump yêu cầu bán lại.

- Trump đã ký sắc lệnh hành pháp giữ TikTok mở trong 75 ngày, nhưng muốn một công ty Mỹ sở hữu 50% TikTok trong tương lai.

- ByteDance đã tăng cường năng lực tính toán ở Đông Nam Á, đặc biệt là Malaysia.

- Công ty đã đặt hàng lớn để xây dựng năng lực AI ở nước ngoài thông qua các thỏa thuận thuê trong năm nay.

- ByteDance cũng phải đối mặt với sự cạnh tranh từ các đối thủ địa phương như Baidu, Alibaba và Tencent, những công ty đang đầu tư mạnh vào AI tạo sinh.

- Chatbot AI Doubao của ByteDance đã trở thành ứng dụng AI phổ biến nhất tại Trung Quốc với 71 triệu người dùng thường xuyên hàng tháng tính đến tháng 12/2024.

- ByteDance là khách hàng lớn nhất của Nvidia tại Trung Quốc, đặt hàng khoảng 230.000 chip của Nvidia trong năm 2024.

📌 ByteDance đang đặt cược lớn vào AI với kế hoạch đầu tư 12 tỷ USD vào chip trong năm 2025, gấp đôi so với năm trước. Tuy nhiên, công ty phải đối mặt với những thách thức từ các quy định xuất khẩu mới của Mỹ và áp lực bán TikTok. Với 71 triệu người dùng chatbot AI Doubao, ByteDance đang dẫn đầu cuộc đua AI tại Trung Quốc.

https://www.ft.com/content/0815c8fb-e6ed-478b-abb1-c67d6f48fd3a

#FT

Chủ sở hữu TikTok, ByteDance, dự kiến sẽ chi 12 tỷ USD cho chip AI vào năm 2025
Công ty Trung Quốc tìm kiếm tăng trưởng từ công nghệ mới trong bối cảnh mảng kinh doanh mạng xã hội chịu áp lực tại Mỹ

Zijing Wu tại Hồng Kông và Eleanor Olcott tại Singapore 10 giờ trước

Roula Khalaf, biên tập viên của FT, chọn những câu chuyện yêu thích của mình trong bản tin hàng tuần này.

Chủ sở hữu TikTok, ByteDance, dự định chi hơn 12 tỷ USD cho cơ sở hạ tầng trí tuệ nhân tạo trong năm nay, đặt cược vào công nghệ tiên tiến để tìm kiếm tăng trưởng mới trong khi chịu áp lực từ Washington về việc bán ứng dụng chia sẻ video phổ biến này tại Mỹ.

Công ty có trụ sở tại Bắc Kinh đã lên kế hoạch ngân sách 40 tỷ nhân dân tệ (5,5 tỷ USD) để mua chip AI tại Trung Quốc vào năm 2025, theo 2 người nắm rõ kế hoạch, con số này gấp đôi so với chi tiêu năm ngoái. Tập đoàn cũng dự định đầu tư khoảng 6,8 tỷ USD ở nước ngoài để tăng cường khả năng huấn luyện mô hình nền tảng bằng cách sử dụng chip Nvidia tiên tiến.

Khoảng 60% đơn hàng bán dẫn nội địa của ByteDance sẽ dành cho các nhà cung cấp Trung Quốc như Huawei và Cambricon, trong khi phần còn lại sẽ được chi cho chip Nvidia bị giảm tính năng để tuân thủ các kiểm soát xuất khẩu của Mỹ, theo những người này.

Chính quyền Bắc Kinh đã đưa ra hướng dẫn không chính thức yêu cầu các công ty công nghệ Trung Quốc mua ít nhất 30% chip từ các nhà cung cấp trong nước, họ nói thêm.

6,8 tỷ USD đầu tư ở nước ngoài được lên kế hoạch để xây dựng năng lực điện toán AI của ByteDance nhằm huấn luyện các mô hình nền tảng. Tuy nhiên, khoản đầu tư này có thể gặp thách thức từ các quy định kiểm soát xuất khẩu của Mỹ được mở rộng gần đây nhằm cản trở các công ty Trung Quốc xây dựng công nghệ nhạy cảm.

Một công nhân cầm tấm wafer bán dẫn trên dây chuyền sản xuất tại một nhà máy ở Binzhou, Trung Quốc
© Chu Baorui/VCG via Getty Images

Bước tiến này diễn ra khi ByteDance đối mặt với áp lực trong mảng kinh doanh mạng xã hội cốt lõi. TikTok đã khôi phục dịch vụ cho 170 triệu người dùng tại Mỹ vào Chủ nhật sau khi Tổng thống sắp nhậm chức Donald Trump cam kết rằng các công ty phân phối và lưu trữ nền tảng này sẽ không phải chịu trách nhiệm pháp lý nếu vi phạm luật Mỹ cấm ứng dụng video này, trừ khi nó được bán.

Trump đã ký một sắc lệnh hành pháp vào thứ Hai để giữ TikTok hoạt động trong 75 ngày, nhưng ông cho biết muốn một công ty Mỹ nắm giữ 50% quyền sở hữu TikTok trong tương lai. Trump nói rằng ông "chắc chắn" có thể áp thuế đối với Trung Quốc nếu nước này từ chối thỏa thuận.

Bất kỳ giao dịch nào như vậy có thể ảnh hưởng đến kế hoạch phát hành cổ phiếu lần đầu ra công chúng của ByteDance trong tương lai, với công ty tự định giá ở mức 300 tỷ USD trong một chương trình mua lại cổ phiếu gần đây.

Công ty đã lập kế hoạch ngân sách lớn để mua các đơn vị xử lý đồ họa (GPU) vào năm 2025 trước khi có các can thiệp gần đây tại Mỹ.

ByteDance, dưới sự lãnh đạo của người sáng lập Zhang Yiming, đã trở thành người tiên phong trong cuộc đua AI tại Trung Quốc, đang đầu tư mạnh mẽ để xây dựng cơ sở hạ tầng AI của mình nhằm huấn luyện mô hình nền tảng, cũng như triển khai các chức năng AI trên nhiều nền tảng khác nhau.

Tập đoàn đã tăng cường năng lực tính toán tại khu vực Đông Nam Á, đặc biệt là ở Malaysia. Mặc dù các công ty Trung Quốc đã bị cấm mua chip Nvidia ngoài Mỹ kể từ năm 2023, họ vẫn có thể tiếp cận chip thông qua các thỏa thuận thuê với các nhà cung cấp trung tâm dữ liệu bên thứ ba, theo nhiều nguồn trong ngành.

Zhang Yiming, nhà sáng lập ByteDance tại một hội nghị gần Jiaxing, Trung Quốc năm 2016
© VCG via Getty Images

Lỗ hổng này đã bị chính quyền Biden sắp mãn nhiệm đóng lại vào tuần trước, với việc ban hành quy định mới yêu cầu danh tính của cả chủ sở hữu và nhà vận hành chip phải trải qua quy trình kiểm tra.

Trong khi Trump có thể có quan điểm khác về kiểm soát xuất khẩu, các quy định này — nếu được thực thi nghiêm ngặt — sẽ khiến việc mua chip của ByteDance ở nước ngoài trở nên khó khăn hơn bao giờ hết.

Công ty đã thực hiện các đơn hàng lớn để xây dựng năng lực AI ở nước ngoài trong năm nay, chẳng hạn thông qua các thỏa thuận thuê, theo một trong những nguồn tin. Điều này có thể đủ đáp ứng hầu hết các nhu cầu của công ty vào năm 2025 nhưng sau đó ra sao vẫn chưa rõ ràng, người này cho biết thêm.

Ngân sách của ByteDance cho việc mua chip AI ở nước ngoài trước đó đã được báo cáo bởi trang tin The Information. Đáp lại bài viết của FT, ByteDance cho biết: "Thông tin dựa trên nguồn ẩn danh về kế hoạch của chúng tôi là không chính xác."

ByteDance cũng phải đối mặt với thách thức từ các đối thủ nội địa có tiềm lực tài chính mạnh như Baidu, Alibaba và Tencent, những công ty đang đầu tư mạnh vào AI tạo sinh. Cùng với các đối thủ này, ByteDance đã tung ra các mô hình ngày càng tiên tiến hơn và giảm chi phí cho các nhà phát triển.

Các công ty Trung Quốc vẫn cần xây dựng năng lực trung tâm dữ liệu AI trong nước để hỗ trợ việc sử dụng các ứng dụng AI ngay cả sau khi các mô hình đã được huấn luyện.

ByteDance dự định sử dụng hầu hết chip AI của Trung Quốc — bao gồm Huawei’s Ascend và Cambricon — cho các tác vụ "suy luận," tức là tính toán mà các mô hình ngôn ngữ lớn thực hiện để tạo ra phản hồi cho các câu lệnh.

ByteDance đã ra mắt chatbot AI Doubao vào tháng 8 năm 2023, và ứng dụng AI này đã trở thành ứng dụng AI phổ biến nhất tại Trung Quốc, theo trang phân tích web Aicpb.com.

Doubao, có nghĩa là "túi đậu" trong tiếng Trung, đạt 71 triệu người dùng hoạt động hàng tháng tính đến tháng 12, so với 300 triệu người dùng hoạt động hàng tuần của OpenAI trên toàn cầu.

Nvidia ghi nhận doanh thu 11,6 tỷ USD từ Trung Quốc, bao gồm Hồng Kông, tương đương khoảng 13% tổng doanh thu toàn cầu, trong 3 quý đầu năm 2024, theo hồ sơ công ty.

ByteDance là khách hàng lớn nhất của Nvidia tại Trung Quốc. Công ty mẹ của TikTok chỉ có thể mua các chip kém tiên tiến hơn như Nvidia’s H20 cho các trung tâm dữ liệu tại Trung Quốc, một phiên bản GPU chuyên dụng và kém mạnh hơn được thiết kế để tuân thủ các kiểm soát xuất khẩu của Mỹ.

Năm 2024, ByteDance đã đặt hàng khoảng 230.000 chip Nvidia, chủ yếu là dòng H20, theo ước tính từ công ty tư vấn công nghệ Omdia. Con số này so với 485.000 chip "Hopper" tiên tiến hơn mà Microsoft đã mua vào năm ngoái và 224.000 mà Meta đã mua.

Các công ty công nghệ trên toàn thế giới đã chi tổng cộng khoảng 229 tỷ USD cho máy chủ trong năm 2024, theo Omdia, dẫn đầu là Microsoft với 31 tỷ USD chi tiêu vốn và Amazon với 26 tỷ USD.

TikTok owner ByteDance plans to spend $12bn on AI chips in 2025
Chinese company seeks growth from new technology as social media business comes under pressure in US

Zijing Wu in Hong Kong and Eleanor Olcott in Singapore 10 hours ago

Roula Khalaf, Editor of the FT, selects her favourite stories in this weekly newsletter.
TikTok owner ByteDance plans to spend more than $12bn on artificial intelligence infrastructure this year, betting on the cutting-edge technology for new growth while under pressure from Washington to sell its popular video-sharing app in the US.
The Beijing-based company has budgeted Rmb40bn ($5.5bn) to acquire AI chips in China in 2025, according to two people familiar with the plans, which would double the amount it spent last year. The group also plans to invest about $6.8bn overseas to beef up its foundation model training capabilities using advanced Nvidia chips.

About 60 per cent of ByteDance’s domestic semiconductor orders would go to Chinese suppliers such as Huawei and Cambricon, while the rest would be spent on Nvidia chips that have been watered down to align with US export controls, according to the people.
Beijing has given Chinese tech companies informal guidance to buy at least 30 per cent of their chips from the country’s own suppliers, the people added.
The $6.8bn in overseas investment was budgeted to build out ByteDance’s AI computing capacity for model training. This investment could face challenges from recently expanded US export controls designed to hamper Chinese companies building sensitive technologies.
A worker holding a semiconductor wafer on the production line of a factory in Binzhou, China
A worker holding a semiconductor wafer on the production line of a factory in Binzhou, China © Chu Baorui/VCG via Getty Images
The push comes as ByteDance faces pressure in its core social media business. TikTok restored service to 170mn US users on Sunday after the country’s incoming President Donald Trump vowed that companies that distributed and hosted the platform would not be held liable for violating a US law that banned the video app unless it was sold.

While Trump signed an executive order on Monday to keep TikTok open for 75 days, he said he wanted a US company to have 50 per cent ownership in TikTok in the future. Trump said he could “certainly” put tariffs on China if it rejected a deal.
Any such transaction could affect plans for a future ByteDance initial public offering, with the company valuing itself at $300bn during a recent share buyback programme.
The company drew up its huge purchasing budget for graphic processing units in 2025 before the recent interventions in the US.
ByteDance, which under the direction of the tech group’s founder Zhang Yiming has become the frontrunner in China’s AI race, is doubling down to build out its own AI infrastructure to train its foundation model, as well as to implement AI functions across its various platforms.
It has ramped up computing capacity in south-east Asia, particularly in Malaysia. Though Chinese companies have been banned from purchasing Nvidia chips outside of the US since 2023, they have been able to secure access to chips through rental agreements with third-party data centre providers, several industry insiders said.
ByteDance founder Zhang Yiming at a conference near Jiaxing, China, in 2016
ByteDance founder Zhang Yiming © VCG via Getty Images
This loophole was closed last week by the outgoing Biden administration, which issued new rules that the identity of both the owner and operator of the chips must undergo a review process.
While Trump could take a different stance on export controls, the regulations — if strictly implemented — would make ByteDance’s chip purchases overseas more difficult than ever.
It has already made large orders to build up overseas AI capacity this year, such as through rental agreements, according to one of the people. It should be sufficient for most of the company’s needs in 2025 but what happened after that remained uncertain, the person added.
ByteDance’s budget for purchases of AI chips overseas was previously reported by news outlet The Information. In response to the FT’s reporting, ByteDance said: “The anonymously sourced information about our plan is incorrect.”
ByteDance also faces challenges from deep-pocketed local competitors, such as Baidu, Alibaba and Tencent, which are investing heavily in generative AI. Alongside these rivals, it has been pushing out more capable models and lowering costs for developers.
Chinese companies still need to build up the capacity of AI data centres onshore to support the use of AI applications even after the models have been trained.
Recommended
ByteDance
TikTok-owner ByteDance takes lead in race to capitalise on AI in China
Zhang Yiming, ByteDance founder
ByteDance plans to use most of its Chinese AI chips — including Huawei’s Ascend and Cambricon — for “inference” tasks, the computation undertaken by large language models to generate a response to a prompt.
ByteDance released its AI chatbot Doubao in August 2023 and the AI app has become China’s most popular AI application, according to website analytics site Aicpb.com.

Doubao, which means “beanbag” in Chinese, had 71mn regular monthly active users as of December, compared with OpenAI’s 300mn weekly active users globally.
Nvidia recorded $11.6bn in revenue from China, including Hong Kong, or about 13 per cent of its global total, during the first three quarters of 2024, according to company filings.
ByteDance is by far the largest client for Nvidia in China. The TikTok parent can only buy less advanced chips such as Nvidia’s H20 for Chinese data centres, a specialised and less-powerful version of its GPUs tailored to align with US export controls.
In 2024, it ordered about 230,000 of Nvidia’s chips, mostly H20s, according to estimates from tech consultancy Omdia. This compares with 485,000 of the more advanced “Hopper” chips bought by Microsoft last year and the 224,000 acquired by Meta.
Tech companies around the world have spent an estimated $229bn on servers in 2024, according to Omdia, led by Microsoft’s $31bn in capital expenditure and Amazon’s $26bn.

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2025-01-22 17:11:14

Microsoft cho phép OpenAI tự dotruy cập vào sức mạnh máy tính của đối thủ

- Microsoft và OpenAI đã công bố sự điều chỉnh trong quan hệ hợp tác vào ngày 22 tháng 1 năm 2025.
- Thỏa thuận mới cho phép OpenAI truy cập vào máy tính của các đối thủ cạnh tranh.
- Microsoft sẽ có quyền ưu tiên cung cấp năng lực máy tính mới cho OpenAI.
- OpenAI có khả năng xây dựng năng lực bổ sung chủ yếu cho nghiên cứu và đào tạo mô hình.
- Mối quan hệ cơ bản giữa hai công ty vẫn giữ nguyên đến năm 2030, với Microsoft giữ quyền độc quyền công nghệ của OpenAI cho các sản phẩm như Copilot.
- API của OpenAI vẫn độc quyền trên nền tảng Azure của Microsoft.
- Hai bên tiếp tục duy trì mô hình chia sẻ doanh thu hai chiều, theo đó Microsoft nhận 20% doanh thu của OpenAI.
- Trước khi có sự thay đổi này, OpenAI đã bị ràng buộc sử dụng độc quyền hạ tầng đám mây Azure cho nhu cầu tính toán của mình.
- Thông báo đi kèm với việc công bố một liên doanh giữa Arm, Microsoft, Nvidia, Oracle và OpenAI nhằm xây dựng một hệ thống trung tâm dữ liệu tại Mỹ mang tên Starbase.
- OpenAI có kế hoạch xây dựng các mô hình đòi hỏi hàng tỷ đô la cho khả năng tính toán.
- Có thông tin cho rằng một số cổ đông của OpenAI cảm thấy Microsoft không cung cấp đủ sức mạnh tính toán nhanh chóng, dẫn đến việc OpenAI hợp tác với Oracle vào tháng 6.
- Đã xuất hiện nhiều tin đồn về việc Microsoft và OpenAI gặp rắc rối trong quan hệ sau khi Giám đốc điều hành OpenAI, Sam Altman, từng bị tạm thời sa thải.
- Microsoft đã thuê CEO của Inflection, Mustafa Suleyman, để dẫn dắt nỗ lực AI tiêu dùng với thỏa thuận trị giá 650 triệu đô la.
- Trong thỏa thuận, có một điều khoản đặc biệt: nếu OpenAI phát triển trí tuệ nhân tạo tổng quát (AGI), nó có thể hạn chế quyền truy cập của Microsoft vào một số mô hình mạnh nhất được phát triển sau đó.
- AGI được định nghĩa là một hệ thống có khả năng tạo ra lợi nhuận hơn 100 tỷ đô la.
- OpenAI đang xem xét việc bỏ qua điều khoản này để có thêm nguồn tài trợ từ Microsoft.

📌 Microsoft và OpenAI đã điều chỉnh thỏa thuận hợp tác, cho phép OpenAI xây dựng năng lực máy tính riêng và truy cập sức mạnh từ đối thủ. Mối quan hệ giữa hai bên tiếp tục giữ nguyên đến 2030, với nhiều điều khoản tài chính quan trọng.

https://www.theverge.com/2025/1/21/24349006/microsoft-openai-compute-partnership

Không có file đính kèm.

Nguồn tham khảo

Semi-Cloud-DC-Green AI chips-hardware-compute 2025-01-22 14:14:40

OpenAI thoát khỏi sự độc quyền đám mây của Microsoft

- OpenAI không còn là đối tác độc quyền của Microsoft trong việc cung cấp cơ sở hạ tầng đám mây.
- Thông báo đi kèm với Stargate, thỏa thuận hạ tầng AI lớn với SoftBank, Oracle và những đối tác khác.
- Microsoft đã ký thỏa thuận mới với OpenAI, cho phép công ty này có "quyền từ chối trước" với dung lượng đám mây mới của OpenAI.
- Điều này có nghĩa là Microsoft sẽ có quyền lựa chọn đầu tiên về việc lưu trữ các khối lượng công việc AI của OpenAI.
- Nếu Microsoft không đáp ứng đủ nhu cầu, OpenAI có thể hợp tác với nhà cung cấp đám mây khác.
- Microsoft khẳng định đã cam kết lớn với Azure, giúp hỗ trợ tất cả sản phẩm của OpenAI cùng với việc đào tạo.
- OpenAI đã gặp khó khăn với việc thiếu dung lượng tính toán, điều này gây căng thẳng trong mối quan hệ với Microsoft.
- Vào tháng 6, Microsoft đã cho phép OpenAI ký thỏa thuận với Oracle để có thêm dung lượng.
- Microsoft vẫn giữ các "yếu tố chính" trong mối quan hệ lâu dài với OpenAI cho đến năm 2030, bao gồm quyền truy cập vào tài sản trí tuệ và các thỏa thuận chia sẻ doanh thu.
- Nếu OpenAI phát triển trí tuệ nhân tạo tổng quát (AGI) trước thời hạn, Microsoft sẽ mất quyền truy cập vào công nghệ của OpenAI.
- OpenAI hiện đang xem xét việc hủy bỏ thỏa thuận để có thể thu hút thêm nguồn vốn từ Microsoft.

📌 Vào tháng 1 năm 2025, OpenAI đã chính thức không còn là đối tác độc quyền của Microsoft trong cung cấp dịch vụ đám mây, mở ra cơ hội hợp tác với nhiều nhà cung cấp mới. Điều này có thể giúp OpenAI giải quyết khó khăn về dung lượng tính toán mà họ đã gặp phải trong quá trình phát triển sản phẩm.

https://techcrunch.com/2025/01/21/microsoft-is-no-longer-openais-exclusive-cloud-provider/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-01-22 07:23:02

Openai và Softbank khởi động dự án Stargate 500 tỷ usd tại Mỹ

OpenAI và SoftBank hợp tác xây dựng hệ thống trung tâm dữ liệu AI lớn nhất thế giới với tổng vốn đầu tư 500 tỷ USD trong 4 năm tới.

Dự án mang tên "The Stargate Project," với các đối tác chính bao gồm OpenAI, SoftBank, Oracle, MGX, Microsoft, NVIDIA và Arm.

Việc xây dựng đã bắt đầu tại Texas, và nhiều địa điểm khác trên khắp nước Mỹ đang được xem xét.

Oracle, NVIDIA và OpenAI sẽ trực tiếp hợp tác trong việc xây dựng và vận hành hệ thống điện toán này.

Microsoft, đối tác chiến lược của OpenAI, công bố gia hạn hợp tác đến năm 2030. Họ vẫn giữ quyền truy cập độc quyền các API và chia sẻ doanh thu từ công nghệ OpenAI, đồng thời ký một cam kết lớn với Azure để hỗ trợ các sản phẩm và đào tạo của OpenAI.

Tuy nhiên, Microsoft không còn giữ độc quyền trong việc mở rộng dung lượng mới; thay vào đó, họ có quyền từ chối đầu tiên đối với các dự án mở rộng của OpenAI.

Sam Altman, Masayoshi Son, và Larry Ellison đã tham dự buổi họp báo tại Nhà Trắng để công bố dự án, nhấn mạnh rằng dự án chỉ thực hiện được nhờ sự thay đổi chính trị tại Mỹ.

Mục tiêu của dự án là xây dựng hạ tầng AI tiên tiến nhất để thúc đẩy các sản phẩm AI của OpenAI và mở rộng hệ sinh thái công nghệ tại Mỹ.

---

📌 Dự án Stargate trị giá 500 tỷ USD do OpenAI và SoftBank dẫn dắt là bước tiến lớn trong phát triển hạ tầng AI tại Mỹ, với sự tham gia của các tập đoàn hàng đầu như Oracle, Microsoft và NVIDIA. Dự án này không chỉ tạo ra hạ tầng điện toán AI mạnh mẽ mà còn khẳng định vai trò của Mỹ trong lĩnh vực công nghệ tương la

https://www.theverge.com/2025/1/21/24348816/openai-softbank-ai-data-center-stargate-project

Không có file đính kèm.

Nguồn tham khảo

103

AI chips-hardware-compute 2025-01-21 20:33:24

RTX 5090: Hiệu suất không như mong đợi so với RTX 4090

- RTX 5090 được dự kiến ra mắt vào cuối tháng 1 năm 2025 với hiệu suất không nổi bật hơn so với RTX 4090.
- Nghiên cứu sơ bộ cho thấy RTX 5090 chỉ tăng 15% điểm số so với RTX 4090 trong kiểm tra OpenCL, đạt 367.740 điểm.
- Trong kiểm tra Vulkan, RTX 5090 ghi nhận 359.742 điểm, cao hơn 37% so với RTX 4090.
- Điểm số CUDA của RTX 5090 đạt 542.157, tốt hơn 27% so với 424.332 điểm của RTX 4090.
- Số lõi CUDA của RTX 5090 cao hơn 32% so với RTX 4090, nhưng hiệu suất lại không như kỳ vọng.
- Trong bài kiểm tra Blender 3.6.0, RTX 5090 ghi nhận điểm số trung bình 17.822,17, nhanh hơn 36% so với 13.064,17 của RTX 4090.
- Biến thể RTX 5090D tại Trung Quốc có điểm số 14.706,65, cao hơn 40% so với RTX 4090D.
- Các benchmark này chủ yếu là tổng hợp và không hoàn toàn phản ánh hiệu suất trong thế giới thực.
- Đánh giá toàn diện hơn về RTX 5090 sẽ được công bố vào cuối tuần này.
- Nvidia cũng đã công bố RTX 5080, RTX 5070 Ti, và RTX 5070 tại CES 2025, với RTX 5090 có giá 1.999 USD.

📌 RTX 5090 không có sự cải thiện vượt trội so với RTX 4090, với các chỉ số benchmark cho thấy sự gia tăng khiêm tốn từ 15% đến 37%. Dự kiến ra mắt vào ngày 30 tháng 1, 2025, nhưng người dùng có thể cần đánh giá thêm để biết hiệu suất thực tế.

https://www.techspot.com/news/106419-rtx-5090-early-benchmarks-show-underwhelming-performance-uplift.html

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-01-20 20:07:24

Bùng nổ chi tiêu AI: 5 gã khổng lồ công nghệ đổ 197 tỷ USD vào cơ sở hạ tầng AI trong năm 2024

- Năm 2024, 5 công ty hyperscaler lớn (Microsoft, Alphabet, Meta, Amazon và Oracle) đã chi khoảng 197 tỷ USD cho cơ sở hạ tầng AI.

- Dự kiến chi tiêu sẽ tiếp tục tăng trong những năm tới, đạt 234 tỷ USD vào năm 2025 và 249 tỷ USD vào năm 2026.

- Microsoft dự kiến sẽ chi 80 tỷ USD chỉ riêng cho trung tâm dữ liệu vào năm 2025.

- Amazon dẫn đầu về chi tiêu vốn, với ước tính 75 tỷ USD trong năm 2024, tăng từ 48,4 tỷ USD năm trước đó.

- Amazon Web Services (AWS), bộ phận dịch vụ đám mây của Amazon, đang đẩy mạnh đầu tư vào cơ sở hạ tầng AI do nhu cầu toàn cầu về các ứng dụng AI tiên tiến.

- Meta Platforms công bố kế hoạch chi tới 40 tỷ USD vào năm 2024, tương đương khoảng 1/4 doanh thu dự kiến hàng năm.

- Trong năm 2024, Meta đã tìm cách mua 350.000 GPU từ Nvidia để huấn luyện các mô hình ngôn ngữ lớn, với tổng chi phí ước tính khoảng 10,5 tỷ USD.

- Google Cloud đã tạo ra hàng tỷ USD doanh thu trong năm 2024 từ đầu tư lớn vào AI, với hơn 2 triệu nhà phát triển phần mềm sử dụng nền tảng này.

- Nhu cầu ngày càng tăng về công suất trung tâm dữ liệu để đào tạo các mô hình AI đang gây áp lực lên các nhà cung cấp hyperscaler.

- Tồn kho bất động sản trung tâm dữ liệu tại Mỹ đã tăng trưởng trung bình 43% hàng năm trong giai đoạn 2023-2024, so với mức tăng chỉ 2% của tồn kho căn hộ.

📌 Năm 2024, 5 công ty công nghệ lớn chi 197 tỷ USD cho cơ sở hạ tầng AI, dự kiến tăng lên 249 tỷ USD vào năm 2026. Amazon dẫn đầu với 75 tỷ USD, trong khi Meta chi 40 tỷ USD. Nhu cầu tăng cao về trung tâm dữ liệu và GPU để phát triển AI.

https://www.visualcapitalist.com/the-rise-of-ai-hyperscaler-spending/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute AI pháp lý-quản trị-chủ quyền 2025-01-14 21:02:27

Thắt chặt kiểm soát chip AI: Mỹ ép các nước trung lập như Singapore phải điều chỉnh quy định

- Mỹ vừa công bố các quy định mới nhằm kiểm soát xuất khẩu chip AI tiên tiến, tác động đến cả các nước có quan hệ thương mại, quân sự thân thiết như Singapore.
- Động thái này nhằm ngăn Trung Quốc và các đối thủ khác tiếp cận công nghệ Mỹ cho các mục đích quân sự và chiến lược khác.
- Quy định mới chỉ cho phép xuất khẩu tự do chip tiên tiến đến 18 quốc gia đồng minh thân cận, bao gồm Anh, Úc, Nhật Bản và Hàn Quốc, giới hạn nhập khẩu ở các quốc gia còn lại, trừ khi họ đạt được thỏa thuận đặc biệt với Mỹ.
- Singapore, quốc gia đứng thứ tư trong việc mua chip Nvidia vào cuối năm 2023 (chiếm 15% doanh thu quý III), có thể bị ảnh hưởng tham vọng AI nếu không tiếp cận đủ nguồn chip tiên tiến.
- Một ví dụ điển hình gần đây là TSMC cắt quan hệ với một công ty Singapore do vi phạm quy định cấm xuất khẩu chip sang Huawei (Trung Quốc).
- Nhiều chip tiên tiến mua tại Singapore đã được chuyển bất hợp pháp sang Trung Quốc, làm dấy lên lo ngại ở Mỹ về lỗ hổng chuỗi cung ứng.

- Mỹ đã thử nghiệm mô hình thỏa thuận với công ty công nghệ G42 của UAE, yêu cầu loại bỏ thiết bị Trung Quốc để đổi lấy quyền sử dụng chip AI tiên tiến. Chính sách mới có xu hướng áp dụng rộng rãi mô hình này trên toàn cầu nhằm bảo vệ vị thế Mỹ trong lĩnh vực AI.
- Nvidia và Hiệp hội ngành công nghiệp bán dẫn đã chỉ trích quy định này là một rào cản làm suy yếu đổi mới toàn cầu, cảnh báo Mỹ có thể mất đi lợi thế cạnh tranh nếu không linh hoạt.
- Trong thời gian ngắn (18 tháng tới), các quốc gia như Singapore có thể miễn cưỡng tuân theo yêu cầu của Mỹ để tiếp cận công nghệ tiên tiến. Tuy nhiên, sự hạn chế về quy mô và khối lượng sẽ trở thành một rào cản lớn cho các công ty Mỹ như Nvidia trong việc duy trì vị trí dẫn đầu thị trường.
- Những thay đổi công nghệ nhanh chóng có thể cho phép Trung Quốc hoặc quốc gia khác vượt qua Mỹ bằng các đột phá trong AI hoặc công nghệ lượng tử, khiến chính sách hiện tại trở nên khó đảo ngược.

---

📌 Chính sách kiểm soát chip AI của Mỹ có thể ép các quốc gia như Singapore phải điều chỉnh quy định để giữ quyền tiếp cận công nghệ tiên tiến. Tuy nhiên, nguy cơ Mỹ mất vị trí dẫn đầu do hạn chế chuỗi cung ứng là hiện thực, với tốc độ thay đổi công nghệ toàn cầu ngày càng nhanh.

https://www.techgoondu.com/2025/01/14/us-ai-chip-controls-could-force-neutral-countries-like-singapore-to-tighten-rules/

Không có file đính kèm.

Nguồn tham khảo

110

AI chips-hardware-compute AI pháp lý-quản trị-chủ quyền 2025-01-13 16:22:25

Nvidia phản đối quy định xuất khẩu mới của Mỹ: Tương lai công nghệ AI bị đe dọa

- Chính phủ Mỹ chuẩn bị ban hành quy định xuất khẩu mới về GPU AI, chỉ cho phép 18 đồng minh và các công ty Mỹ có quyền truy cập không bị giới hạn.
- Các quốc gia khác sẽ chỉ được tiếp cận GPU AI với điều kiện có trạng thái người dùng cuối đã được xác thực (VEU).
- Trung Quốc, Nga, Macau và một số quốc gia khác nằm trong danh sách cấm vận sẽ phải đối mặt với lệnh cấm nhập khẩu GPU AI gần như toàn bộ.
- Ned Finkle, Phó Chủ tịch Quan hệ Chính phủ của Nvidia, lên án quyết định này, cho rằng chính sách sẽ gây tổn hại đến nền kinh tế Mỹ và tạo lợi thế cho các đối thủ.
- Quy định mới chia thế giới thành 3 cấp độ với quyền truy cập khác nhau:
- Cấp 1: Mỹ và 18 đồng minh (bao gồm Australia, Canada, Đức, Nhật Bản...) sẽ có quyền truy cập gần như không bị hạn chế vào các bộ xử lý AI.
- Cấp 2: Hầu hết các quốc gia còn lại phải chịu giới hạn về năng lực tính toán, với mức trần khoảng 50.000 GPU từ 2025 đến 2027.
- Cấp 3: Các quốc gia như Belarus, Trung Quốc, Nga sẽ bị cấm nhập khẩu bộ xử lý AI từ Mỹ gần như toàn bộ.
- Nvidia hiện không thể xuất khẩu card đồ họa GeForce RTX 4090 mạnh nhất sang Trung Quốc do lo ngại về việc sử dụng cho đào tạo và suy luận AI.
- Ngoài việc hạn chế phần cứng, quy định còn giới hạn xuất khẩu trọng số mô hình AI kín, đòi hỏi công ty phải tuân thủ tiêu chuẩn an ninh để lưu trữ mô hình tại cấp 2.
- Hiệp hội Ngành công nghiệp bán dẫn thúc giục chính phủ xem xét lại kế hoạch này trước khi thực hiện.
- Nvidia và các chuyên gia trong ngành cho rằng quyết định này sẽ đẩy các công ty Trung Quốc tìm kiếm công nghệ thay thế, gây áp lực cạnh tranh cho Nvidia trong tương lai.

📌 Chính phủ Mỹ dự kiến áp dụng các quy định xuất khẩu mới đối với GPU AI, chia thế giới thành 3 cấp độ. Điều này có thể gây ra tác động tiêu cực đến nền kinh tế và thúc đẩy các công ty Trung Quốc tìm kiếm công nghệ thay thế.

https://www.tomshardware.com/tech-industry/artificial-intelligence/nvidia-and-sia-fire-back-at-u-s-govs-new-export-restrictions-on-ai-gpus-to-china

Nvidia and SIA fire back at US gov's new export restrictions on AI GPUs to China

News

By Anton Shilov

published 3 days ago

However, companies in the U.S. and allied nations will get unrestricted access.

Bloomberg reports that the Biden administration is preparing a final set of export restrictions on advanced AI GPUs. Under the new rules, only companies from the U.S. and 18 allies can buy AI GPUs without limits.

Entities from other countries will have limited access to AI GPUs unless they obtain validated end user (VEU) status. China, Russia, Macau, and other arms-embargoed nations will face a near-total ban on AI GPU imports. Nvidia and the Semiconductor Industry Association (SIA) strongly oppose the decision.

"AI is mainstream computing – ubiquitous and essential as electricity," a statement by Ned Finkle, Vice President of Government Affairs at Nvidia, reads. "This last-minute Biden Administration policy would be a legacy that will be criticized by U.S. industry and the global community. We would encourage President Biden to not preempt incoming President Trump by enacting a policy that will only harm the U.S. economy, set America back, and play into the hands of U.S. adversaries."

The new export rules reportedly divide the world into three tiers; each tier will have a different level of access to advanced AI GPUs developed in the U.S.

Tier 1: The U.S. and 18 allies (including Australia, Belgium, Canada, Denmark, Finland, Germany, France, French Guiana, Ireland, Italy, Japan, the Netherlands, New Zealand, Norway, South Korea, Sweden, Taiwan, and the U.K.) will have 'near-unrestricted access' to advanced AI processors developed in the U.S. That rule will apply provided they meet U.S. security requirements and do not install over 25% their processing capabilities outside of Tier 1 countries. While they are permitted to install some of their processors in Tier 2 nations, they cannot install more than 7% of their capacity in any single Tier 2 country. U.S.-based firms must ensure at least half their computing power remains in the country.
Tier 2: Most countries in the world (including Eastern Europe, the Middle East, Mexico, and Latin America) will face limits on computing power they can procure. Bloomberg claims that the limits include a cap of approximately 50,000 GPUs between 2025 and 2027, though it is unclear which GPUs do they mean (Blackwell GPUs are about four times more powerful in AI than Hopper GPUs, a significant difference). However, individual companies from these countries will be able to get higher compute capability if they obtain 'validated end user' (VEU) status by complying with U.S. regulations.
Tier 3: Belarus, China, Iran, Macau, Russia, and other arms-embargoed nations face a near-total ban on AI processor imports from the U.S. There are no details available on the matter. However, even today Nvidia cannot ship its most powerful GeForce RTX 4090 graphics card to China as it could be used for AI training and inference. If the government further reduces performance caps, then a wider range of processors developed in the U.S. will be banned from shipping to the People's Republic.

In addition to hardware restrictions, the plan limits the export of closed AI model weights. Companies are barred from hosting powerful models in Tier 3 nations and must comply with security standards to host them in Tier 2 countries. Open-weight models remain unrestricted. However, suppose an AI company intends to fine-tune a general-purpose open-weight model for a specific application that requires substantial computing power. In that case, it must obtain a U.S. government license to carry out the work in a Tier 2 country, according to the report.

The proposal has drawn criticism from the semiconductor industry in general and Nvidia in particular. The Semiconductor Industry Association also expressed concerns, calling for more deliberation and industry input before implementing changes of such magnitude.

"It makes no sense for the Biden White House to control everyday data center computers and technology already in gaming PCs worldwide, disguised as an anti-China move," Finkle wrote. "The extreme 'country cap' policy will affect mainstream computers in countries around the world, doing nothing to promote national security but pushing the world to alternative technologies."

Despite the criticism, U.S. officials consider the policy a strategic move to leverage American dominance in AI technology. American chips outperform Chinese counterparts, giving the U.S. a unique opportunity to shape global standards and attract companies and nations toward its technological orbit. Nvidia opposes the move, saying it will encourage Chinese companies to find alternatives to American technology, which will hurt Nvidia's short-term sales and pose competitive pressure in the long term.

https://www.bloomberg.com/news/articles/2025-01-08/biden-to-further-limit-nvidia-amd-ai-chip-exports-in-final-push

Biden tiếp tục siết chặt xuất khẩu chip AI của Nvidia trong nỗ lực cuối cùng
Các quốc gia vùng Vịnh và Đông Nam Á sẽ đối mặt với giới hạn mới
Động thái mở rộng các hạn chế chất bán dẫn tới hầu hết các quốc gia trên thế giới

Biden lên kế hoạch áp thêm giới hạn với xuất khẩu chip AI của Nvidia
Mackenzie Hawkins và Jenny Leonard
Ngày 8 tháng 1 năm 2025, lúc 9:36 PM UTC
Cập nhật lúc 11:36 PM UTC

Chính quyền Tổng thống Joe Biden lên kế hoạch áp đặt thêm một vòng hạn chế nữa đối với việc xuất khẩu các chip trí tuệ nhân tạo (AI) từ những công ty như Nvidia Corp., chỉ vài ngày trước khi ông rời nhiệm sở. Đây là nỗ lực cuối cùng trong chiến lược của ông nhằm ngăn chặn các công nghệ tiên tiến rơi vào tay Trung Quốc và Nga.

Mỹ muốn hạn chế việc bán các chip AI sử dụng trong trung tâm dữ liệu dựa trên cả cơ sở quốc gia và công ty, với mục tiêu tập trung phát triển AI ở các quốc gia đồng minh và thúc đẩy các doanh nghiệp trên toàn cầu tuân thủ các tiêu chuẩn của Mỹ, theo những người quen thuộc với vấn đề này.

Kết quả sẽ là mở rộng các hạn chế thương mại chất bán dẫn sang hầu hết các quốc gia trên thế giới — một nỗ lực nhằm kiểm soát sự lan rộng của công nghệ AI trong bối cảnh nhu cầu đang tăng vọt. Các quy định, có thể được ban hành ngay từ thứ Sáu, sẽ tạo ra ba cấp độ hạn chế đối với chip AI, theo các nguồn tin, những người yêu cầu giấu tên vì các cuộc thảo luận vẫn đang trong vòng bí mật.

Ở cấp cao nhất, một số ít đồng minh của Mỹ sẽ được duy trì quyền tiếp cận gần như không giới hạn với các chip của Mỹ. Trong khi đó, một nhóm các quốc gia đối địch sẽ gần như bị cấm hoàn toàn nhập khẩu chất bán dẫn. Phần lớn còn lại của thế giới sẽ đối mặt với giới hạn về tổng công suất tính toán có thể nhập khẩu vào một quốc gia.

Các hạn chế mới đối với xuất khẩu chip trên toàn cầu

Hầu hết các thị trường sẽ đối mặt với các hạn chế mới trong phát triển trung tâm dữ liệu:

Cấp 1 (ít hạn chế nhất): Một số ít đồng minh của Mỹ sẽ có quyền tiếp cận không giới hạn với các chip tiên tiến của Mỹ, miễn là đáp ứng các yêu cầu an ninh của Mỹ.
Cấp 2: Hầu hết các quốc gia khác trên thế giới sẽ đối mặt với các giới hạn về công suất tính toán. Các công ty trong các quốc gia này có thể được phép vượt giới hạn nếu đạt trạng thái "người dùng cuối được xác minh" (VEU) bằng cách tuân thủ các tiêu chuẩn an ninh và nhân quyền của Mỹ.
Cấp 3 (hạn chế nghiêm ngặt nhất): Các quốc gia như Belarus, Trung Quốc, Iran, Macau và Nga sẽ gần như bị cấm hoàn toàn nhập khẩu chip AI từ Mỹ.

Theo các nguồn tin, các công ty đặt trụ sở tại các quốc gia thuộc nhóm cuối cùng (Cấp 3) có thể vượt qua giới hạn quốc gia nếu đạt được trạng thái VEU, cho phép họ hưởng giới hạn cao hơn đáng kể. Trạng thái này nhằm tạo ra một nhóm các thực thể được tin cậy, phát triển và triển khai AI trong các môi trường an toàn trên toàn thế giới.

Phản ứng từ ngành công nghiệp bán dẫn

Sau khi Bloomberg đưa tin về kế hoạch, cổ phiếu Nvidia — nhà sản xuất chip AI hàng đầu — đã giảm hơn 1% trong phiên giao dịch ngoài giờ. Trước đó, cổ phiếu của Nvidia đã tăng 4,3% từ đầu năm đến nay, sau mức tăng vọt trong các năm 2023 và 2024, biến công ty thành nhà sản xuất chip có giá trị nhất thế giới.

Cổ phiếu của Advanced Micro Devices Inc. (AMD), đối thủ lớn nhất của Nvidia trong lĩnh vực bộ xử lý AI, giảm dưới 1% trong giao dịch ngoài giờ.

Nvidia đã phản đối mạnh mẽ đề xuất này trong một tuyên bố:

"Một quy định vào phút cuối nhằm hạn chế xuất khẩu đến hầu hết các quốc gia sẽ là một sự thay đổi chính sách lớn, không làm giảm nguy cơ lạm dụng mà lại đe dọa tăng trưởng kinh tế và vị thế dẫn đầu của Mỹ," Nvidia cho biết. "Sự quan tâm trên toàn thế giới đối với điện toán tăng tốc trong các ứng dụng hàng ngày là một cơ hội lớn để Mỹ phát triển, thúc đẩy nền kinh tế và tạo thêm việc làm tại Mỹ."

Chính quyền Biden tiếp tục siết chặt xuất khẩu chip AI, nhằm hạn chế Trung Quốc và Nga

Hạn chế mở rộng đến nhiều quốc gia trên thế giới

Chính quyền Tổng thống Joe Biden đang chuẩn bị ban hành thêm một loạt hạn chế cuối cùng đối với xuất khẩu chip trí tuệ nhân tạo (AI), như các sản phẩm của Nvidia, chỉ vài ngày trước khi Biden rời nhiệm sở. Đây là nỗ lực cuối cùng nhằm ngăn chặn các công nghệ tiên tiến rơi vào tay Trung Quốc và Nga.

Những biện pháp này, được xây dựng trên nền tảng các hạn chế nhiều năm qua, đã giới hạn khả năng của các nhà sản xuất chip Mỹ như Nvidia và AMD trong việc bán các bộ xử lý tiên tiến tại Trung Quốc và Nga. Mỹ cũng tìm cách ngăn các quốc gia đối địch tiếp cận công nghệ tiên tiến thông qua các trung gian ở các khu vực như Trung Đông và Đông Nam Á. Các quy định mới nhất này là một phần của nỗ lực toàn cầu nhằm kiểm soát sự lan rộng của công nghệ AI trong bối cảnh nhu cầu tăng vọt.

Ba cấp độ hạn chế chip AI

Quy định mới chia thế giới thành ba cấp độ:

Cấp 1 (ít hạn chế nhất): Bao gồm Mỹ và 18 đồng minh như Đức, Hà Lan, Nhật Bản, Hàn Quốc và Đài Loan. Các công ty ở những quốc gia này có thể tự do triển khai sức mạnh tính toán và được phép nộp đơn xin giấy phép toàn diện từ chính phủ Mỹ để xuất khẩu chip sang hầu hết các quốc gia khác. Tuy nhiên, các công ty phải đảm bảo rằng không quá 25% tổng công suất tính toán của họ được đặt ngoài các quốc gia thuộc Cấp 1, và không quá 7% ở bất kỳ quốc gia nào thuộc Cấp 2. Các công ty Mỹ cũng phải giữ ít nhất 50% tổng công suất tính toán trên lãnh thổ Mỹ.
Cấp 2: Bao gồm phần lớn các quốc gia khác trên thế giới. Các quốc gia này sẽ bị giới hạn tổng công suất tính toán mà họ có thể nhập khẩu — tương đương khoảng 50.000 GPU từ năm 2025 đến 2027. Tuy nhiên, các công ty cá nhân tại các quốc gia này có thể tiếp cận giới hạn cao hơn đáng kể nếu họ đạt trạng thái "người dùng cuối được xác minh" (validated end user - VEU), bằng cách đáp ứng các tiêu chuẩn an ninh và nhân quyền của Mỹ.
Cấp 3 (hạn chế nghiêm ngặt nhất): Bao gồm Trung Quốc, Macau, Nga và tất cả các quốc gia bị Mỹ áp đặt cấm vận vũ khí — khoảng hơn 20 quốc gia. Xuất khẩu chip đến các trung tâm dữ liệu tại các quốc gia này gần như bị cấm hoàn toàn.

Động lực và tác động

Các quy định mới đi kèm các hạn chế không chỉ về phần cứng mà còn về các trọng số mô hình AI (model weights) đóng kín. Các công ty bị cấm lưu trữ các trọng số mô hình mạnh mẽ tại các quốc gia Cấp 3 như Trung Quốc và Nga, và phải tuân thủ các tiêu chuẩn an ninh để lưu trữ chúng tại các quốc gia Cấp 2. Tuy nhiên, các quy định này không áp dụng cho các công ty đạt trạng thái VEU toàn diện.

Các mô hình trọng số mở (open weight models) không bị ảnh hưởng bởi các quy định, cũng như các mô hình đóng có năng lực yếu hơn các mô hình mở đã được công bố. Nhưng nếu một công ty AI muốn tinh chỉnh một mô hình trọng số mở cho một mục đích cụ thể, và quy trình này yêu cầu sử dụng lượng lớn công suất tính toán, họ sẽ phải xin giấy phép từ chính phủ Mỹ để thực hiện tại một quốc gia thuộc Cấp 2.

Sự phản đối từ ngành công nghiệp

Nvidia và Hiệp hội Công nghiệp Bán dẫn (SIA) đã phản đối mạnh mẽ các quy định này. SIA cho rằng việc thay đổi chính sách có phạm vi lớn như vậy không nên được ban hành vội vàng trong giai đoạn chuyển giao tổng thống mà không có sự tham vấn đáng kể từ ngành công nghiệp.

"Một thay đổi chính sách lớn như vậy không nên được thông qua một cách vội vàng mà không có sự tham gia đầy đủ từ ngành công nghiệp," SIA tuyên bố. "Có quá nhiều điều quan trọng cần được cân nhắc kỹ lưỡng để đảm bảo rằng đất nước chúng ta có thể cạnh tranh và giành chiến thắng trên toàn cầu."

Nvidia cũng phản đối, nhấn mạnh rằng:

"Một quy định vào phút cuối hạn chế xuất khẩu đến hầu hết các quốc gia sẽ là một sự thay đổi chính sách lớn, không giảm thiểu nguy cơ lạm dụng nhưng lại đe dọa tăng trưởng kinh tế và vị thế dẫn đầu của Mỹ."

Mục tiêu chiến lược

Bất chấp sự phản đối, chính quyền Mỹ coi các quy định này là một cơ hội chiến lược để tận dụng vị trí thống trị của Mỹ trong công nghệ AI. Như một bức thư từ các nghị sĩ hàng đầu thuộc Ủy ban Chọn lọc về Trung Quốc của Hạ viện Mỹ gửi tới Bộ trưởng Thương mại Gina Raimondo nêu rõ:

"Nhu cầu về công nghệ AI của Mỹ là cơ hội để kéo các công ty và quốc gia ra khỏi quỹ đạo của Bắc Kinh."

Bằng cách sử dụng vị thế như một "người gác cổng," Mỹ hy vọng định hình các tiêu chuẩn AI toàn cầu và củng cố mối quan hệ với các quốc gia đồng minh trong bối cảnh cạnh tranh công nghệ ngày càng gay gắt với Trung Quốc.

Biden to Further Limit Nvidia AI Chip Exports in Final Push
Gulf states and Southeast Asian countries would face new caps
Move would expand semiconductor restrictions to most of world

Biden Plans Additional Limits on Nvidia AI Chip Exports
By Mackenzie Hawkins and Jenny Leonard
January 8, 2025 at 9:36 PM UTC
Updated on January 8, 2025 at 11:36 PM UTC

President Joe Biden’s administration plans one additional round of restrictions on the export of artificial intelligence chips from the likes of Nvidia Corp. just days before leaving office, a final push in his effort to keep advanced technologies out of the hands of China and Russia.
The US wants to curb the sale of AI chips used in data centers on both a country and company basis, with the goal of concentrating AI development in friendly nations and getting businesses around the world to align with American standards, according to people familiar with the matter.
The result would be an expansion of semiconductor trade restrictions to most of the world — an attempt to control the spread of AI technology at a time of soaring demand. The regulations, which could be issued as soon as Friday, would create three tiers of chip curbs, said the people, who asked not to be identified because the discussions are private.
At the top level, a small number of US allies would maintain essentially unmitigated access to American chips. A group of adversaries, meanwhile, would be effectively blocked from importing the semiconductors. And the vast majority of the world would face limits on the total computing power that can go to one country.
US to Curb Global Chip Shipments
Most markets will face new restrictions on data center development
Tier 1 (Most permissive)Tier 2Tier 3 (Most restrictive)
Source: Bloomberg reporting
Note: Mapped data show level of restrictions on chip shipments for distinct markets
Companies headquartered in nations in that last group would be able to bypass their national limits — and get their own, significantly higher caps — by agreeing to a set of US government security requirements and human rights standards, according to the people. That type of designation — called a validated end user, or VEU — aims to create a set of trusted entities that develop and deploy AI in secure environments around the world.
Why World Powers Are Sparring Over Computer Chips: QuickTake
Shares of Nvidia, the leading maker of AI chips, dipped more than 1% in late trading after Bloomberg reported on the plan. They had been up 4.3% this year through the close, following stratospheric gains in 2023 and 2024 that turned the company into the world’s most valuable chipmaker.
Advanced Micro Devices Inc., Nvidia’s biggest challenger in AI processors, dropped less than 1% in extended trading.
Nvidia objected to the proposal in a statement. “A last-minute rule restricting exports to most of the world would be a major shift in policy that would not reduce the risk of misuse but would threaten economic growth and US leadership,” Nvidia said. “The worldwide interest in accelerated computing for everyday applications is a tremendous opportunity for the US to cultivate, promoting the economy and adding US jobs.”

A representative of the White House’s National Security Council declined to comment. The Commerce Department’s Bureau of Industry and Security, which is in charge of chip export controls, didn’t immediately respond to a request for comment.

The measures build on years of curbs that already limit the ability of American chipmakers like Nvidia and AMD to sell advanced processors in China and Russia. The US also has sought to prevent adversary nations from accessing cutting-edge technology through intermediaries in places like the Middle East and Southeast Asia. The latest draft rules are part of that global effort.

Nvidia's headquarters in Santa Clara, California, US.

Nvidia’s headquarters in Santa Clara, California, US.Photographer: David Paul Morris/Bloomberg

The rules follow months of debate over how quickly and broadly to deploy US chips to global data centers. Because American chips far outperform Chinese ones at AI tasks, companies and entire countries have indicated that they’re willing to jump through hoops to gain access to US technology. That gives the US a unique role as a gatekeeper — and a potentially significant amount of leverage to shape global AI development.

Read More: Microsoft AI Deal With G42 at Risk Over National Security Fears

The US has “a serious once-in-a-generation moment to leverage US AI technology,” the top Democrat and Republican on the House China Select Committee wrote last week in a letter to Commerce Secretary Gina Raimondo. “Demand for US AI technology is an opportunity to pry both companies and countries out of Beijing’s orbit.”

The first tier established in the new rules includes the US and 18 allies, such as Germany, the Netherlands, Japan, South Korea and Taiwan, according to people familiar with the matter.

Companies can freely deploy computing power in those places, and firms headquartered there can apply for blanket US government permission to ship chips to data centers in most other parts of the world. That’s provided that no more than a quarter of their total computing power is located outside of Tier 1 countries, and no more than 7% in any one Tier 2 country. Companies would also have to abide by US government security requirements.

Additionally, US-headquartered companies that apply for that type of permission — a so-called universal VEU designation — have to keep at least half of their total computing power on American soil, people familiar with the matter said. The broader goal of these regulations is ensuring that the US and allied countries always have more computing power than the rest of the world.

Restrictive Tiers

The vast majority of countries fall into the second tier of restrictions, which establishes maximum levels of computing power that can go to any one nation — equivalent to about 50,000 graphic processing units, or GPUs, from 2025 to 2027, the people said. But individual companies can access significantly higher limits — that grow over time — if they apply for VEU status in each country where they wish to build data centers.

Get the Weekend Edition newsletter.

Big ideas and open questions in the fascinating places where finance, life and culture meet. Coming soon.

Enter your email

By continuing, I agree to the Privacy Policy and Terms of Service.

Getting that approval requires a demonstrated track record of meeting US government security and human rights standards, or at least a credible plan for doing so. Security requirements span physical, cyber and personnel concerns. If companies obtain national VEU status, their chip imports won’t count against the maximum totals for that country — a measure to encourage firms to work with the US government and adopt American AI standards.

The third, most restrictive tier affects China, Macau and all countries for which the US maintains an arms embargo — about two dozen nations in total, according to the people. Shipments to data centers in those places are broadly prohibited.

Like Nvidia, the Semiconductor Industry Association trade group opposes the move.

“A policy change of this scope and significance should not be rushed out the door during a period of presidential transition and without meaningful input from industry,” the association said in a statement. “Too much is at stake here to circumvent a deliberative process. Our country needs to get this right so we can compete and win globally.”

Model Weights

In addition to the semiconductor controls, the new rules also limit the export of closed AI model weights, which are the numerical parameters that software uses to process data and make predictions or decisions.

Companies would be prohibited from hosting powerful closed model weights in Tier 3 countries, like China and Russia, and would have to abide by security standards to host those weights in Tier 2 countries. That means the controls on model weights don’t apply to companies that obtain universal VEU status, one of the people said.

Open weight models — which allow the public to access underlying code — aren’t affected by the rules, nor are closed models that are less powerful than an already-available open model. But if an AI company wants to fine-tune a general-purpose open weight model for a specific purpose, and that process uses a significant amount of computing power, they would need to apply for a US government license to do so in a Tier 2 country.

— With assistance from Ian King

Không có file đính kèm.

Nguồn tham khảo

154

AI chips-hardware-compute 2025-01-09 14:48:21

CEO Nvidia khẳng định chip AI của công ty phát triển nhanh hơn quy luật Moore

- Nvidia đang dẫn đầu trong lĩnh vực phát triển chip AI với hiệu suất vượt qua quy luật Moore.
- Giám đốc điều hành Jensen Huang tuyên bố các hệ thống của Nvidia phát triển nhanh hơn so với dự đoán 2 năm một lần theo quy luật Moore.
- Quy luật Moore, được tạo ra bởi Gordon Moore, dự đoán số lượng transistor trên chip sẽ gấp đôi sau mỗi 2 năm.
- Chip siêu máy tính mới nhất của Nvidia nhanh hơn 30 lần so với thế hệ trước khi xử lý các công việc suy luận AI.
- Huang nhấn mạnh rằng sự phát triển đồng bộ trong kiến trúc, chip, hệ thống, thư viện và thuật toán giúp Nvidia vượt trội hơn cả quy luật Moore.
- Dòng chip H100 trước đây được ưa chuộng giờ đây đang được thay thế bằng GB200 NVL72, nhanh hơn 30-40 lần cho các công việc suy luận AI.
- Nhiều phòng thí nghiệm AI hàng đầu như Google và OpenAI đều đang sử dụng chip AI của Nvidia để đào tạo và vận hành mô hình AI.
- Huang công nhận rằng sự phát triển của AI không hề chậm lại, mà ngược lại, đang diễn ra theo 3 quy luật mở rộng: tiền đào tạo, sau đào tạo và tính toán trong thời gian suy diễn.
- Dù chip AI của Nvidia có giá cao, Huang tin rằng hiệu suất cao hơn sẽ làm giảm chi phí hoạt động của các mô hình AI trong tương lai.
- Trên thực tế, chi phí cho các mô hình AI đã giảm đáng kể trong năm qua nhờ vào những cải tiến về phần cứng từ Nvidia.
- Huang khẳng định chip AI hiện tại của Nvidia đã cải thiện 1.000 lần so với cách đây 10 năm, nhanh hơn nhiều so với quy luật Moore.

📌 Các chip AI của Nvidia hiện đã cải thiện 1.000 lần so với 10 năm trước, với hiệu suất mới tăng 30-40 lần, hứa hẹn giảm chi phí cho mô hình AI trong tương lai.

https://techcrunch.com/2025/01/07/nvidia-ceo-says-his-ai-chips-are-improving-faster-than-moores-law/

Không có file đính kèm.

Nguồn tham khảo

149

AI chips-hardware-compute 2025-01-09 10:43:12

Trung Quốc đang phát triển AI mạnh mẽ bất chấp các hạn chế chip của Mỹ

- Trung Quốc đã công bố lộ trình phát triển AI vào năm 2017, với mục tiêu dẫn đầu toàn cầu vào năm 2030.
- Năm 2020, Trung Quốc dự kiến có những "tiến bộ mang tính biểu tượng" trong lĩnh vực AI để thể hiện sự phát triển.
- Sự ra mắt của ChatGPT vào cuối năm 2022 khiến Trung Quốc bất ngờ, khi các công ty công nghệ hàng đầu nội địa vẫn đang phục hồi sau cuộc đàn áp kéo dài 18 tháng.
- Chính quyền Biden đã áp dụng các biện pháp kiểm soát xuất khẩu chip nhằm ngăn chặn Trung Quốc tiếp cận các vi mạch tiên tiến cần thiết cho việc đào tạo mô hình AI quy mô lớn.
- Tháng 11 năm 2024, Alibaba và DeepSeek giới thiệu các mô hình lý luận có sức cạnh tranh với OpenAI, cho thấy sự thu hẹp khoảng cách giữa Mỹ và Trung Quốc.
- Tencent đã ra mắt Hunyuan-Large, một mô hình nguồn mở vượt qua các tiêu chí đánh giá của các mô hình hàng đầu từ Mỹ.
- DeepSeek cũng đã phát hành DeepSeek-v3, hiện đứng đầu trong các mô hình AI nguồn mở và cạnh tranh tốt với các hệ thống đóng của OpenAI và Anthropic.
- Eric Schmidt, cựu CEO của Google, đã thay đổi quan điểm về sự dẫn đầu của Mỹ trong AI, nhận xét rằng sự phát triển của Trung Quốc là "kinh ngạc".
- Các biện pháp kiểm soát xuất khẩu chip của Mỹ gặp khó khăn trong việc ngăn chặn sự phát triển của Trung Quốc, khi nhiều công ty đã tích trữ chip trước khi các lệnh cấm có hiệu lực.
- Việc Trung Quốc sản xuất các mô hình AI mạnh mẽ bằng cách sử dụng chip ít mạnh mẽ hơn cho thấy khả năng tối ưu hóa tài nguyên.
- Vào tháng 10 năm 2023, Mỹ siết chặt các quy định xuất khẩu chip sau khi Trung Quốc sử dụng các kẽ hở trong chính sách kiểm soát.
- Dữ liệu huấn luyện cho các mô hình AI lớn được lấy từ Internet và dễ tiếp cận, trong khi chip lại khó sản xuất và kiểm soát hơn.
- Các công ty Mỹ như Nvidia và AMD nắm giữ vị thế độc quyền trong thị trường chip cho AI, nhưng việc kiểm soát xuất khẩu vẫn gặp nhiều thách thức.
- Trong tương lai, việc xuất khẩu chip sẽ tiếp tục ảnh hưởng đến khả năng phát triển AI của Trung Quốc, trong khi các nước đang phát triển phải đối mặt với lựa chọn giữa AI của Mỹ và Trung Quốc.

📌 Sự phát triển nhanh chóng của Trung Quốc trong lĩnh vực AI khiến Mỹ phải xem xét lại cách thức kiểm soát xuất khẩu chip. Dữ liệu cho thấy các mô hình AI của Trung Quốc đã tiến gần hơn đến khả năng của Mỹ, tạo ra những thách thức mới cho vị thế lãnh đạo công nghệ toàn cầu.

https://time.com/7204164/china-ai-advances-chips/

#TIME

Không có file đính kèm.

Nguồn tham khảo

Semi-Cloud-DC-Green AI chips-hardware-compute 2025-01-08 17:19:42

Các xu hướng chính đang làm thay đổi các trung tâm dữ liệu vào năm 2025

- Trung tâm dữ liệu chịu áp lực ngày càng tăng về nhu cầu năng lượng và công nghệ mới vào năm 2025.
- Năm 2023, nguồn năng lượng toàn cầu đạt khoảng 620EJ (172.000TWh), chủ yếu từ dầu khí, than và khí tự nhiên.
- Trung tâm dữ liệu tiêu thụ khoảng 460TWh trong năm 2022, chiếm khoảng 2% nhu cầu điện toàn cầu, dự báo sẽ vượt 1.000TWh vào năm 2026.
- Nhu cầu tính toán cao kỳ vọng sẽ tăng mạnh với sự phát triển của AI và AI tạo sinh, yêu cầu về cơ sở hạ tầng cũng tăng theo.
- Năm 2023, mô hình ChatGPT-4 ước tính có khoảng 500 tỷ tham số, tỷ lệ năng lượng tiêu thụ cho một truy vấn từ 1-10Wh, trung bình 4.5Wh, cao gấp 15 lần so với tìm kiếm Google.
- Các trung tâm dữ liệu AI chuyên dụng đang nổi lên, dự kiến tiêu thụ từ 100 đến 300TWh vào năm 2026.
- Các giải pháp năng lượng mới như microgrid và hệ thống lưu trữ năng lượng đang được phát triển để đáp ứng nhu cầu năng lượng gia tăng.
- Công nghệ làm mát bằng chất lỏng được áp dụng rộng rãi, giúp cải thiện hiệu suất và tiết kiệm năng lượng trong các trung tâm dữ liệu.
- Liên minh Châu Âu ban hành quy định về việc đánh giá tính bền vững của các trung tâm dữ liệu, yêu cầu báo cáo hiệu suất năng lượng và bền vững định kỳ.
- Nỗ lực về tính bền vững và hiệu quả sẽ đóng vai trò quan trọng trong việc chuyển đổi sang môi trường không phát thải, trong khi AI có thể giúp tối ưu hóa hệ thống phức tạp.

📌 Công nghệ trung tâm dữ liệu vào năm 2025 sẽ tập trung vào nhu cầu năng lượng gia tăng do tính toán cao, áp dụng công nghệ làm mát chất lỏng, và nỗ lực bền vững với quy định mới từ EU, hướng tới hiệu quả và giảm phát thải khí nhà kính.

https://www.datacenterdynamics.com/en/opinions/four-key-trends-disrupting-data-centers-in-2025/

Không có file đính kèm.

Nguồn tham khảo

124

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-01-08 17:02:28

Microsoft dự kiến đầu tư 3 tỷ USD vào AI và cloud tại Ấn Độ và đào tạo 10 triệu người

- Microsoft sẽ đầu tư 3 tỷ USD để mở rộng trí tuệ nhân tạo (AI) và dịch vụ đám mây tại Ấn Độ.
- CEO Satya Nadella thông báo đầu tư tại một sự kiện ở Bengaluru.
- Công ty đã hoạt động tại Ấn Độ hơn 20 năm, cam kết tạo ra điều kiện thuận lợi cho AI tại đây.
- Dự kiến sẽ đào tạo thêm 10 triệu người ở Ấn Độ về AI.
- Nadella nhấn mạnh rằng tần suất áp dụng AI tại Ấn Độ rất đáng khích lệ.
- Ấn Độ là thị trường nước ngoài quan trọng với nhiều gã khổng lồ công nghệ Mỹ như Microsoft.
- Cạnh tranh gia tăng nhanh chóng tại Ấn Độ khi Microsoft liên tục cập nhật các tính năng AI mới.
- Amazon cũng đã công bố kế hoạch đầu tư 12.7 tỷ USD vào thị trường Ấn Độ đến năm 2030.
- Microsoft hiện có 3 khu vực trung tâm dữ liệu tại Ấn Độ và dự kiến khai trương khu vực thứ 4 vào năm tới.
- Khoản đầu tư 3 tỷ USD sẽ được sử dụng để phát triển hệ sinh thái máy tính AI phục vụ các startup và cộng đồng nghiên cứu tại Ấn Độ.
- Ấn Độ được xem là một trong những thị trường phát triển nhanh nhất thế giới với hơn 17 triệu lập trình viên sử dụng GitHub của Microsoft.
- Nhiều giám đốc điều hành công nghệ lớn như Nvidia và AMD đã thăm Ấn Độ trong thời gian gần đây để tìm kiếm tài năng phát triển.
- Microsoft đã ký một bản ghi nhớ hợp tác với SaaSBoomi, một cộng đồng cho các startup B2B tại Ấn Độ.
- Mục tiêu hợp tác là thúc đẩy tinh thần khởi nghiệp tại các thành phố và thị trấn nhỏ và thu hút thêm 1.5 tỷ USD vốn đầu tư cho các startup AI và SaaS tại Ấn Độ.
- Nadella cho biết nhiều khách hàng Ấn Độ đã và đang sử dụng công nghệ mới nhất của Microsoft, bao gồm Infosys, Air India, Meesho và nhiều công ty khác.
- Công ty IT Persistent đã sử dụng “Contract Assist” từ Microsoft 365 Copilot để giảm thời gian thương thảo hợp đồng xuống 70%.

📌 Microsoft đầu tư 3 tỷ USD vào AI và đám mây ở Ấn Độ, sẽ đào tạo 10 triệu người. Hợp tác với SaaSBoomi nhằm thúc đẩy khởi nghiệp tại các thành phố nhỏ, mục tiêu thu hút thêm 1.5 tỷ USD vốn đầu tư.

https://techcrunch.com/2025/01/07/microsoft-to-pump-3-billion-into-cloud-and-ai-push-in-india/

Không có file đính kèm.

Nguồn tham khảo

100

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-01-08 05:30:09

Trump công bố kế hoạch 20 tỷ USD xây dựng trung tâm dữ liệu AI tại Mỹ với đối tác UAE

- Tổng thống đắc cử Donald Trump thông báo tỷ phú UAE Hussain Sajwani, người sáng lập DAMAC Properties, sẽ đầu tư 20 tỷ USD vào các trung tâm dữ liệu mới tại Mỹ

- Giai đoạn đầu của dự án sẽ triển khai tại 8 bang: Arizona, Illinois, Indiana, Louisiana, Michigan, Ohio, Oklahoma và Texas

- Các trung tâm dữ liệu này sẽ chủ yếu hỗ trợ công nghệ AI và điện toán đám mây

- Cần thận trọng vì các cam kết đầu tư tương tự trong quá khứ đã thất bại. Ví dụ: Foxconn chỉ tạo ra 1.000 việc làm thay vì 13.000 như đã hứa và chỉ đầu tư 1 tỷ USD thay vì 10 tỷ USD tại Wisconsin

- Trump chỉ trích mạnh mẽ CHIPS Act của chính quyền Biden, dù đạo luật này đã thu hút đầu tư gấp 10 lần tổng số tiền tài trợ từ 5 nhà sản xuất chip hàng đầu thế giới

- Microsoft đang đầu tư 80 tỷ USD vào trung tâm dữ liệu AI, khẳng định thành công phụ thuộc vào "quan hệ đối tác mới dựa trên đầu tư cơ sở hạ tầng quy mô lớn"

- CEO OpenAI Sam Altman ủng hộ quan điểm của Trump về việc xây dựng cơ sở hạ tầng tại Mỹ đang quá khó khăn do thủ tục hành chính phức tạp

📌 Kế hoạch đầu tư 20 tỷ USD vào trung tâm dữ liệu AI tại 8 bang của Mỹ từ tỷ phú UAE đối mặt với thách thức từ tiền lệ thất bại của Foxconn. Trump chỉ trích CHIPS Act nhưng nhận được ủng hộ từ các lãnh đạo công nghệ về việc cải thiện môi trường xây dựng cơ sở hạ tầng.

https://techcrunch.com/2025/01/07/trump-announces-20b-plan-to-build-new-data-centers-in-the-us/

Cựu Tổng thống Donald Trump đã nhiều lần chỉ trích mạnh mẽ Đạo luật CHIPS và Khoa học trong chiến dịch tranh cử của mình[1][2].

## Những chỉ trích chính của Trump

**Về cơ chế tài trợ**
- Trump cho rằng việc cấp hàng tỷ đô la trợ cấp cho các công ty giàu có là không cần thiết[1].
- Ông đề xuất nên áp dụng thuế quan cao thay vì trợ cấp để buộc các công ty sản xuất chip đầu tư vào Mỹ[2].

**Về hiệu quả chương trình**
- Trump nhận định thỏa thuận về chip rất tồi tệ và sẽ không thu hút được các công ty tốt đầu tư vào Mỹ[1].
- Ông cho rằng chính phủ không cần phải chi một xu nào, chỉ cần áp thuế cao là các công ty sẽ tự đầu tư[2].

## Tác động tiềm tàng

**Đối với các dự án hiện tại**
- Chính quyền Biden đang gấp rút phân bổ 39 tỷ USD còn lại trước khi rời nhiệm sở[5].
- Đã có hơn 33 tỷ USD được phân bổ cho 32 dự án, nhưng mới chỉ giải ngân 123 triệu USD[2].

**Triển vọng trong tương lai**
- Trump có thể điều chỉnh các yêu cầu về lực lượng lao động và loại bỏ một số điều khoản tiến bộ trong hướng dẫn thực hiện[6].
- Các chuyên gia cho rằng việc thay đổi hoàn toàn đạo luật sẽ gặp phải sự phản đối từ các nghị sĩ Đảng Cộng hòa có tiểu bang hưởng lợi từ CHIPS Act[6].

Citations:
[1] https://www.nytimes.com/2024/10/26/us/politics/trump-joe-rogan-chips-science-act.html
[2] https://www.manufacturingdive.com/news/trump-harris-election-chips-act-semiconductors-funding/731738/
[3] https://finance.yahoo.com/news/chipmakers-rushing-chips-act-money-100000726.html
[4] https://spectrumnews1.com/oh/columbus/news/2024/12/10/chips-act-trump-intel
[5] https://www.aei.org/technology-and-innovation/a-dangerous-trump-chips-challenge/
[6] https://www.techtarget.com/searchdatacenter/news/366615473/CHIPS-Act-expected-to-survive-change-under-Trump
[7] https://www.fox10phoenix.com/news/experts-arent-worried-chips-science-act-arizona-after-trumps-comments
[8] https://www.barrons.com/articles/trump-biden-chips-act-cash-nvidia-intel-1f8baf31
[9] https://www.aljazeera.com/economy/2024/12/19/as-trump-two-point-o-looms-taiwans-chip-industry-braces-for-upheaval
[10] https://www.npr.org/2024/10/28/nx-s1-5167750/kamala-harris-donald-trump-semiconductor-chips-michigan

Không có file đính kèm.

Nguồn tham khảo

103

AI chips-hardware-compute 2025-01-08 04:57:18

CES 2025: Nvidia tung loạt sản phẩm đột phá với GPU mạnh gấp 8 lần

- Jensen Huang, CEO Nvidia, đã công bố dòng GPU desktop đầu tiên sau hơn 2 năm tại CES 2025 ở Las Vegas.

- Dòng GeForce RTX 50-series:
- RTX 5090: 92 tỷ bóng bán dẫn, xử lý 3.352 nghìn tỷ phép tính AI/giây, giá 1.999 USD
- RTX 5080: 1.800 TOPS, giá 999 USD
- RTX 5070 Ti: 1.400 TOPS, giá 749 USD
- RTX 5070: 1.000 TOPS, giá 549 USD

- Project DIGITS - máy tính siêu cường cá nhân cho nghiên cứu AI:
- Trang bị chip GB10 Grace Blackwell
- Xử lý mô hình ngôn ngữ lớn đến 200 tỷ tham số
- RAM 128GB, bộ nhớ flash 4TB
- Giá khởi điểm 3.000 USD, ra mắt tháng 5

- Công nghệ robot học bắt chước:
- Nâng cấp mô hình GR00T
- Tích hợp kính Apple Vision Pro
- Ứng dụng trong sản xuất và hậu cần trị giá 50 nghìn tỷ USD

- Nền tảng Cosmos cho mô hình nền tảng thế giới:
- Huấn luyện trên 9.000 nghìn tỷ token
- 20 triệu giờ dữ liệu từ nhiều lĩnh vực
- Hợp tác với Uber và Wayve

- Hợp tác với Toyota phát triển xe tự hành:
- Sử dụng máy tính DRIVE AGX Orin
- Dự kiến doanh thu mảng ô tô đạt 5 tỷ USD

📌 Nvidia đã tạo bước đột phá tại CES 2025 với GPU RTX 5090 mạnh gấp đôi thế hệ trước, máy tính AI cá nhân 3.000 USD, robot học bắt chước qua kính thực tế ảo và hợp tác Toyota về xe tự hành, dự kiến mang về 5 tỷ USD doanh thu.

https://www.techrepublic.com/article/nvidia-keynote-ces-2025/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2025-01-06 00:12:30

Microsoft công bố kế hoạch đầu tư kỷ lục 80 tỷ USD vào AI năm 2025

- Microsoft thông báo kế hoạch đầu tư 80 tỷ USD trong năm tài chính 2025 để mở rộng năng lực trung tâm dữ liệu AI

- Hơn 50% tổng đầu tư sẽ tập trung tại Mỹ, thể hiện cam kết của Microsoft với nền kinh tế Mỹ

- Khoản đầu tư này vượt xa dự đoán của các nhà phân tích và đối thủ cạnh tranh như Google, Meta và xAI

- Kế hoạch bao gồm xây dựng cơ sở hạ tầng cho các trung tâm dữ liệu có khả năng hỗ trợ tủ rack tiêu thụ điện từ 120kW đến 140kW, tăng từ mức 40kW hiện tại

- Microsoft được cho là một trong những khách hàng chính của nền tảng Blackwell từ Nvidia

- Công ty có kế hoạch vận hành các nhà máy điện hạt nhân quy mô nhỏ và lớn vào năm 2028 để cung cấp năng lượng cho trung tâm dữ liệu

- Brad Smith, chủ tịch Microsoft, so sánh AI với các bước ngoặt của cách mạng công nghiệp như động cơ hơi nước và điện khí hóa

- Microsoft khẳng định vai trò dẫn đầu của Mỹ trong cuộc đua AI toàn cầu nhờ đầu tư từ vốn tư nhân và đổi mới sáng tạo

- Công ty nhấn mạnh tầm quan trọng của quan hệ đối tác với OpenAI và sự phát triển của các công ty như Anthropic và xAI

📌 Microsoft định hình lại cuộc đua AI toàn cầu với khoản đầu tư kỷ lục 80 tỷ USD vào năm 2025, tập trung vào phát triển cơ sở hạ tầng trung tâm dữ liệu tiên tiến với 50% đầu tư tại Mỹ, bao gồm kế hoạch phát triển nguồn điện hạt nhân vào năm 2028.

https://www.tomshardware.com/tech-industry/artificial-intelligence/microsoft-surprises-analysts-with-massive-usd80b-ai-investment-plans-for-2025

Không có file đính kèm.

Nguồn tham khảo

114

AI chips-hardware-compute 2024-12-30 06:45:09

Nvidia đạt tăng trưởng ấn tượng tại thị trường Trung Quốc với dòng GPU H20 giảm hiệu năng

- GPU HGX H20 của Nvidia tại thị trường Trung Quốc đạt mức tăng trưởng 50% mỗi quý, cao hơn nhiều so với mức 25% của dòng H100

- Nvidia phải cắt giảm hiệu năng GPU H20 để tuân thủ quy định hạn chế xuất khẩu của Mỹ, không thể bán các dòng cao cấp H100, H200 và H800 cho Trung Quốc

- Doanh thu từ H20 đạt hàng chục tỷ USD bất chấp hiệu năng bị giảm so với H100 nguyên bản

- Công ty AI Deepseek của Trung Quốc vừa công bố huấn luyện mô hình DeepSeek-V3 với 671 tỷ tham số trên cụm 2.048 GPU H800 trong 2 tháng, tổng thời gian 2,8 triệu giờ GPU

- So sánh: Meta đầu tư nhiều hơn 11 lần (30,8 triệu giờ GPU) để huấn luyện Llama 3 có 405 tỷ tham số, sử dụng 16.384 GPU H100 trong 54 ngày

- Các công ty trong nước của Trung Quốc như Biren Technologies và Moore Threads đang phát triển chip AI để cạnh tranh với Nvidia

- Mỹ và Trung Quốc đang chạy đua phát triển khả năng AI. OpenAI kiếm được hàng tỷ USD nhưng vẫn cần thêm phần cứng để tăng năng lực huấn luyện và suy luận AI

📌 Bất chấp lệnh cấm vận, GPU H20 giảm hiệu năng của Nvidia vẫn tăng trưởng 50% mỗi quý tại Trung Quốc. Deepseek huấn luyện mô hình 671 tỷ tham số trên 2.048 GPU H800 trong 2,8 triệu giờ GPU, hiệu quả hơn 11 lần so với Meta.

https://www.tomshardware.com/tech-industry/artificial-intelligence/nvidias-defeatured-h20-gpus-in-china-sell-surprisingly-well-50-percent-increase-every-quarter-in-sanctions-compliant-gpus-for-chinese-ai-customers

Không có file đính kèm.

Nguồn tham khảo

103

AI chips-hardware-compute Semi-Cloud-DC-Green 2024-12-28 09:31:50

Trung tâm dữ liệu AI đang phát triển với quy mô khổng lồ, dài quá 2 km

- Gary Smith, CEO của công ty Ciena chuyên sản xuất thiết bị mạng quang học, cho biết các trung tâm dữ liệu AI đang phát triển với quy mô khổng lồ chưa từng thấy

- Nhiều trung tâm dữ liệu có chiều dài vượt quá 2km (tương đương 1,24 dặm), với thiết kế nhiều tầng tạo thêm chiều cao bên cạnh diện tích mặt bằng

- Các khuôn viên doanh nghiệp đang phải nỗ lực để hỗ trợ các cụm GPU với quy mô ngày càng tăng, làm mờ ranh giới giữa mạng diện rộng và mạng nội bộ trung tâm dữ liệu

- Thomas Graham, đồng sáng lập Lightmatter, tiết lộ có ít nhất 12 trung tâm dữ liệu AI mới đang được lên kế hoạch hoặc xây dựng, mỗi trung tâm tiêu thụ 1 gigawatt điện

- Dự kiến đến năm 2026, việc xử lý AI toàn cầu sẽ cần đến 40 gigawatt điện năng, tương đương mức tiêu thụ của 8 thành phố New York

- Công nghệ kết nối trực tiếp của Nvidia như NVLink đang chịu áp lực lớn do khoảng cách kết nối và tốc độ GPU

- Ciena đang phát triển thiết bị quang học tương tự như trong mạng viễn thông đường dài nhưng được điều chỉnh để kết nối GPU trong trung tâm dữ liệu

📌 Trung tâm dữ liệu AI đang phát triển vượt xa 2km chiều dài, với 12 trung tâm mới đang được xây dựng. Dự báo năm 2026 sẽ tiêu thụ 40 gigawatt điện, cần công nghệ kết nối quang học mới để đáp ứng tốc độ xử lý của GPU.

https://www.zdnet.com/article/ai-data-centers-are-becoming-mind-blowingly-large/

Không có file đính kèm.

Nguồn tham khảo

129

AI chips-hardware-compute 2024-12-10 17:28:27

Marvell Technology: Công ty chip nhỏ vượt mặt Intel với giá trị thị trường 100 tỷ USD

- Giá trị thị trường của Marvell Technology đã tăng vượt mốc 100 tỷ USD, đánh dấu thành công vượt bậc của công ty.
- Matt Murphy, CEO của Marvell từ năm 2016, từ chối mời gọi từ Intel bất chấp việc ông nằm trong danh sách ứng viên thay thế Pat Gelsinger.
- Tại cuộc họp báo cáo thu nhập gần đây, Murphy khẳng định cam kết với Marvell và sự tự hào về công nghệ của công ty.
- Cổ phiếu Marvell đã tăng 60% tính từ đầu năm đến nay, cùng với 18% tăng thêm sau báo cáo thu nhập gần đây.
- Doanh thu từ trung tâm dữ liệu của Marvell đã tăng gần gấp đôi so với năm trước, đạt 1,1 tỷ USD trong quý gần nhất.
- Dự đoán rằng doanh thu từ mảng trung tâm dữ liệu sẽ chiếm khoảng 72% tổng doanh thu trong năm tài chính này, so với 40% của năm trước.
- Marvell đã ký hợp đồng 5 năm với Amazon để giúp thiết kế chip AI riêng, trong khi Amazon đang mở rộng nỗ lực sản xuất chip nội bộ để giảm phụ thuộc vào Nvidia.
- Amazon đã công bố chip AI mới nhất, Trainium, tại hội nghị phát triển hàng năm, dự kiến sẽ đẩy mạnh doanh thu chip AI tùy chỉnh của Marvell.
- Các nhà phân tích dự đoán doanh thu hàng năm của Marvell sẽ đạt hơn 8 tỷ USD vào năm tài chính 2026, tăng 40% so với năm nay.
- Sự phát triển trong lĩnh vực chip AI tùy chỉnh có thể giúp Marvell chiếm một phần ba trong thị trường tiềm năng trị giá 30-50 tỷ USD đến năm 2030.
- Tuy nhiên, công ty có thể gặp rủi ro từ sự thay đổi trong sự đầu tư vào AI, nếu các dịch vụ không thu hút được người dùng.
- Murphy hiểu rằng việc tiêu thụ thiết bị đã mua có thể dẫn đến thời kỳ "tiêu hóa," nhưng vẫn lạc quan về tương lai của công ty.

📌 Marvell Technology đang trải qua sự tăng trưởng mạnh mẽ, với doanh thu từ trung tâm dữ liệu gần gấp đôi, hợp tác với Amazon về chip AI, và dự kiến doanh thu vượt 8 tỷ USD vào năm tài chính 2026, tăng 40% so với năm trước.

https://www.wsj.com/tech/marvell-ai-chip-manufacturing-faa89cb6

#WSJ

Hãng chip nhỏ giờ đây có giá trị hơn Intel

Vai trò của Marvell trong việc giúp các "gã khổng lồ" công nghệ tạo ra chip trung tâm dữ liệu của riêng họ đã thúc đẩy doanh thu—và định giá của hãng
Tác giả: Dan Gallagher
Ngày 8 tháng 12, 2024, 9:30 sáng ET

Giá trị vốn hóa thị trường của Marvell Technology đã vượt qua 100 tỷ USD trong tuần qua.
Matt Murphy không hứng thú với việc điều hành một công ty chip có quy mô gấp 10 lần công ty hiện tại của mình. Đó là một quyết định khôn ngoan, và thực tế là một tham vọng lớn hơn.
Murphy, người đã đảm nhiệm vai trò CEO của Marvell Technology từ năm 2016, là một trong số ít cái tên được đề cập như ứng viên tiềm năng thay thế Pat Gelsinger, người vừa bị sa thải khỏi vị trí lãnh đạo Intel. Điều này dẫn đến tình huống hiếm hoi khi một CEO sử dụng cuộc họp báo cáo lợi nhuận của công ty để bác bỏ tin đồn rằng mình sẵn sàng nhận vai trò mới.
“Tôi hoàn toàn gắn bó với Marvell,” ông nói trong cuộc họp ngày 3 tháng 12, một ngày sau khi Intel thông báo sa thải Gelsinger và các phương tiện truyền thông đưa tin Murphy là một ứng viên. “Công ty đang phát triển mạnh. Công nghệ của chúng tôi thuộc hàng tốt nhất. Tôi không thể nghĩ ra nơi nào tốt hơn để làm việc ngoài Marvell.”
Thời điểm của Murphy rất hợp lý. Báo cáo lợi nhuận mạnh mẽ cùng với tin tức về mối quan hệ hợp tác mở rộng với Amazon đã giúp cổ phiếu của Marvell tăng vọt. Trước đó, cổ phiếu đã tăng 60% trong năm nay. Sau báo cáo hôm thứ Ba, giá cổ phiếu đã tăng thêm 18%, đưa giá trị vốn hóa thị trường của Marvell lần đầu tiên vượt mốc 100 tỷ USD (giá trị này chỉ khoảng 5 tỷ USD khi Murphy nhận vị trí CEO).
Những tăng trưởng gần đây thậm chí còn giúp vốn hóa thị trường của Marvell vượt qua Intel, dù Intel vẫn tạo ra doanh thu hàng năm cao gấp 10 lần.

Hướng đi gần đây của Marvell cho thấy khoảng cách doanh thu sẽ tiếp tục thu hẹp. Sự bùng nổ của mảng kinh doanh trung tâm dữ liệu đã đạt đến mức đủ để bù đắp sự suy yếu trong các phân khúc cũ hơn của công ty, vốn bán chip dùng trong các thiết bị như thiết bị viễn thông, hộp cáp truyền hình và ô tô.
Doanh thu từ trung tâm dữ liệu đã gần như tăng gấp đôi so với cùng kỳ năm ngoái, đạt 1,1 tỷ USD trong quý vừa qua. Marvell dự kiến trong quý hiện tại, mảng trung tâm dữ liệu sẽ chiếm khoảng 72% tổng doanh thu cả năm tài chính kết thúc vào tháng 1, tăng mạnh so với mức 40% của năm trước.

Dự báo cho năm tới cũng rất tích cực. Thỏa thuận mới nhất của Marvell với Amazon là một hợp đồng “đa thế hệ” kéo dài 5 năm, trong đó Marvell sẽ hỗ trợ Amazon thiết kế chip trí tuệ nhân tạo của riêng mình. Amazon, nhà cung cấp dịch vụ điện toán đám mây lớn nhất thế giới, đang mở rộng đáng kể các nỗ lực phát triển chip nội bộ, một phần để giảm sự phụ thuộc vào Nvidia trong các thành phần AI quan trọng. Amazon đã công bố thế hệ tiếp theo của con chip AI lớn nhất của họ, có tên là Trainium, tại hội nghị nhà phát triển thường niên tuần này. Các nhà phân tích tin rằng Trainium sẽ góp phần vào việc doanh thu từ chip AI tùy chỉnh của Marvell tăng hơn gấp đôi trong năm tài chính kết thúc vào tháng 1 năm 2026.

Điều này được dự đoán sẽ giúp doanh thu hàng năm của Marvell vượt mốc 8 tỷ USD trong năm tài chính 2026, tăng 40% so với kỳ vọng của năm nay, theo ước tính từ Visible Alpha. Ngoài ra, công ty dự kiến tăng trưởng 20% cho năm tiếp theo, khi Marvell bước vào sản xuất chip AI tùy chỉnh cho một khách hàng lớn khác mà các nhà phân tích cho rằng là Microsoft. Nhà phân tích Mark Lipacis của Evercore ISI dự báo ngành công nghiệp chip AI tùy chỉnh sẽ đạt doanh thu từ 30 tỷ đến 50 tỷ USD vào năm 2030. Trong một ghi chú gửi khách hàng tuần trước, ông nói rằng Marvell “có tiềm năng chiếm một phần ba thị trường đó.”

Điều gì có thể gây trở ngại? Giống như Nvidia, Marvell có mức độ phụ thuộc lớn vào các khoản đầu tư AI đang bùng nổ, điều này khiến công ty dễ bị tổn thương nếu chi tiêu trong lĩnh vực này giảm. Điều này có thể xảy ra nếu các dịch vụ AI mà các “gã khổng lồ” công nghệ và khách hàng doanh nghiệp đưa ra không thu hút được người dùng. Những khách hàng lớn này thậm chí có thể tạm ngừng chi tiêu để sử dụng hết các thiết bị đã mua. Những giai đoạn “tiêu hóa” như vậy từ lâu đã phổ biến trên thị trường trung tâm dữ liệu. Nhưng với giá cổ phiếu hiện giao dịch ở mức gần 45 lần lợi nhuận kỳ vọng, cao hơn 21% so với mức định giá của Nvidia, Marvell không được định giá cho bất kỳ cú sốc nào dù là nhỏ nhất.

Murphy không lo lắng. “Sẽ có những giai đoạn điều chỉnh,” ông nói trong một cuộc phỏng vấn, đồng thời cho biết thêm rằng AI chỉ là một phần trong những gì thúc đẩy đầu tư vào các hệ thống tính toán tăng tốc. Với 30 năm kinh nghiệm trong ngành chip, ông cũng hiểu rõ những chu kỳ khắc nghiệt của ngành. “Chúng tôi biết nó sẽ không đi theo đường thẳng trong 10 năm tới,” ông nói.

Hai năm tới sẽ đủ bận rộn để giữ chân ông.

Meet the Small AI Chip Maker Now More Valuable Than Intel

Marvell’s role in helping tech titans create their own data center chips has boosted its revenue—and valuation

Dan Gallagher

Dec. 8, 2024 9:30 am ET

Marvell Technology’s market capitalization briefly rose above $100 billion this past week.

Matt Murphy has no interest in running a chip company 10 times the size of his current one. It is the smarter move, and actually the more ambitious one.

Murphy, who has served as chief executive officer of Marvell Technology since 2016, has been among the few names floated as potential replacements for the recently oustedPat Gelsinger at Intel’s corner office. That led to the rare sight of a CEO using his own earnings call to deny that he is on the market.

“I am all in,” he said on Marvell’s Dec. 3 call, the day after Intel announced Gelsinger’s exit and various media outlets reported Murphy as a candidate. “The company is outstanding. The technology is best-in-class. I can’t think of a better place to work than Marvell.”

His timing was good. A strong earnings report and news of an expanded relationship with Amazon lit up Marvell’s stock, which had already risen 60% for the year at the start of the week. The shares have jumped another 18% since Tuesday’s report, putting Marvell’s market capitalization briefly above $100 billion for the first time ever (it was around $5 billion when Murphy took the job).

The latest gains have even put Marvell’s market cap ahead of much-beleaguered Intel, which still generates 10 times as much annual revenue.

Marvell’s recent trajectory suggests that the revenue gap will continue to narrow. The explosive growth of its data center business has finally reached a point where it can more fully offset weakness in the company’s more legacy segments, which sell chips used in goods such as telecommunications gear, cable TV boxes and autos.

Data center sales nearly doubled year over year to $1.1 billion in the just-ended quarter, and Marvell’s projection for the current period indicates the company will end its fiscal year in January with the data center unit encompassing about 72% of its total revenue, up from 40% in the previous year.

The next year is looking bright as well. Marvell’s latest deal with Amazon is a five-year “multigenerational” agreement that has Marvell helping Amazon design its own artificial intelligence chips. Amazon, which runs the world’s largest cloud computing service, has been expanding its internal chip efforts significantly, in part to reduce its reliance on Nvidia for crucial AI components. Amazon announced the next generation of its largest AI chip, called Trainium, at its annual developers conference this week. Analysts believe Trainium will play a role in Marvell’s AI custom revenue more than doubling in the next fiscal year ending January of 2026.

That is expected to help propel Marvell’s annual revenue to more than $8 billion in fiscal 2026, up 40% from what is expected for this year, according to consensus estimates from Visible Alpha. In addition, 20% growth is expected for the following year, when Marvell expects to be in production of custom AI chips for another unnamed big tech customer that analysts believe to be Microsoft. Analyst Mark Lipacis of Evercore ISI projects that the industry for custom AI chips will reach $30 billion to $50 billion in sales by 2030. In a note to clients last week, he said Marvell “has the potential to capture one-third of that market.”

What could spoil the party? Like Nvidia, Marvell has significant exposure to booming AI investments that makes the company vulnerable to any downturns in that spending. That could happen if the AI services propagated by tech giants and their business customers fail to catch on with users. The same big tech buyers could even put a temporary pause on spending to absorb equipment already purchased. Such “digestion” periods have long been common in the data center market. But with its stock now trading nearly 45 times forward earnings—a 21% premium to Nvidia’s multiple—Marvell isn’t priced for the slightest of speed bumps.

Murphy isn’t worried. “We’ll see digestion at some point,” he said in an interview, adding that AI is only part of what is driving investment in so-called accelerated computing systems. His 30 years in the chip business have also acquainted him well with the industry’s brutal cycles. “We know it’s not going to be a straight line over the next 10 years,” he said.

The next two alone should keep him busy enough.

Không có file đính kèm.

Nguồn tham khảo

114

AI chips-hardware-compute 2024-12-10 00:33:54

Bytedance vượt mặt Alibaba và Baidu trở thành khách hàng chip lớn nhất của Nvidia tại châu Á

- Bytedance đã trở thành khách hàng mua chip lớn nhất của Nvidia tại châu Á, vượt qua Alibaba và Baidu

- Công ty đang tích cực tuyển dụng kỹ sư AI từ các đối thủ như Alibaba và các startup như 01.ai và Zhipu

- Zhang Yiming, người sáng lập Bytedance, dẫn dắt sáng kiến này trong bối cảnh:
+ Tăng trưởng của Douyin (TikTok phiên bản Trung Quốc) đã chậm lại
+ Tòa án Mỹ yêu cầu bán TikTok trước tháng 1/2025 hoặc đối mặt với lệnh cấm

- Do quy định xuất khẩu của Mỹ:
+ Tại Trung Quốc: Bytedance chỉ được mua GPU H20 của Nvidia - phiên bản có hiệu năng thấp hơn
+ Bên ngoài Trung Quốc: Công ty có thể tiếp cận chip H100 và Blackwell hiệu năng cao

- Bytedance đang phát triển chip AI riêng dựa trên mô hình Tensor Processing Unit của Google để giảm phụ thuộc vào Nvidia

- Giá trị của Bytedance đã tăng lên 300 tỷ USD bất chấp nguy cơ bị cấm tại Mỹ

- Công ty cũng tìm kiếm nhà cung cấp chip trong nước như Huawei, dự định sử dụng chip Ascend 910B để huấn luyện mô hình ngôn ngữ lớn

📌 Bytedance đã vươn lên thành khách hàng chip số 1 của Nvidia tại châu Á, đầu tư hàng tỷ USD vào cơ sở hạ tầng AI. Công ty phát triển song song cả chip riêng và hợp tác với Huawei, trong bối cảnh đạt định giá 300 tỷ USD dù đối mặt lệnh cấm tại Mỹ.

https://www.benzinga.com/24/12/42382237/tiktok-parent-bytedance-now-nvidias-largest-buyer-in-asia-races-ahead-of-alibaba-and-baidu-to-dominate-chinas-generative-ai-market-report

Không có file đính kèm.

Nguồn tham khảo

128

AI deepfake-ảo giác-ANTT AI chips-hardware-compute 2024-11-27 07:01:30

Jensen Huang, CEO Nvidia chia sẻ về vấn đề ảo giác AI, nhu cầu điện toán tăng vọt

- Jensen Huang, CEO Nvidia nhận định ngành công nghiệp cần vài năm nữa mới có thể giải quyết vấn đề ảo giác AI - hiện tượng AI tạo ra thông tin sai để lấp đầy khoảng trống kiến thức

- Nhu cầu điện toán AI tăng gấp 4 lần mỗi năm. Trong 10 năm, con số này đã tăng 1 triệu lần, góp phần đẩy cổ phiếu Nvidia tăng 300 lần

- Huang chia sẻ 3 lĩnh vực phát triển AI hiện nay:
+ Pre-training: AI tiếp nhận và khám phá kiến thức từ dữ liệu toàn cầu
+ Post-training: AI đào sâu kỹ năng cụ thể thông qua học tăng cường
+ Test time scaling: AI "suy nghĩ" để giải quyết vấn đề theo từng bước

- Đóng góp lớn nhất của Nvidia là giảm chi phí điện toán xuống 1 triệu lần trong 10 năm qua, giúp machine learning phát triển mạnh mẽ

- Câu chuyện thú vị về cách Huang theo đuổi vợ:
+ Gặp vợ khi mới 17 tuổi (vợ 19 tuổi)
+ Dùng chiêu bài "làm bài tập cùng nhau mỗi chủ nhật"
+ Hứa sẽ trở thành CEO lúc 30 tuổi để thuyết phục vợ kết hôn

📌 Nvidia đã giảm chi phí điện toán AI 1 triệu lần trong 10 năm qua nhưng vẫn cần vài năm nữa để giải quyết vấn đề ảo giác AI. Jensen Huang thành công trong cả sự nghiệp lẫn tình yêu nhờ tầm nhìn xa và chiến lược thông minh.

https://www.tomshardware.com/tech-industry/artificial-intelligence/jensen-says-we-are-several-years-away-from-solving-the-ai-hallucination-problem-in-the-meantime-we-have-to-keep-increasing-our-computation

Không có file đính kèm.

Nguồn tham khảo

149

AI môi trường-năng lượng AI chips-hardware-compute 2024-11-27 06:42:58

Phương pháp mới có thể giảm 95% năng lượng tiêu thụ cho ứng dụng AI, nhưng cần phần cứng chuyên dụng mới

- BitEnergy AI giới thiệu phương pháp tính toán mới có tên Linear-complexity multiplication, có khả năng giảm 95% năng lượng tiêu thụ cho các ứng dụng AI

- Phương pháp này thay thế cách tính nhân dấu phẩy động (floating-point multiplication - FPM) truyền thống bằng phép cộng số nguyên

- FPM hiện được sử dụng phổ biến trong AI vì cho phép xử lý số liệu rất lớn hoặc rất nhỏ với độ chính xác cao, tuy nhiên tiêu tốn nhiều năng lượng nhất trong quá trình xử lý AI

- Theo các nhà nghiên cứu, phương pháp mới không ảnh hưởng đến hiệu suất của ứng dụng AI

- Thách thức lớn nhất là phương pháp này đòi hỏi phần cứng khác với hiện tại. Các ứng dụng AI hiện nay chạy trên phần cứng được tối ưu hóa cho tính toán dấu phẩy động như GPU của Nvidia

- Đội nghiên cứu cho biết phần cứng cần thiết đã được thiết kế, chế tạo và thử nghiệm, nhưng vẫn cần được cấp phép và chưa rõ khi nào sẽ có mặt trên thị trường

- Dữ liệu cho thấy riêng ChatGPT tiêu thụ khoảng 564 MWh điện mỗi ngày, đủ cung cấp cho 18.000 hộ gia đình Mỹ

- Các chuyên gia dự đoán trong vài năm tới, các ứng dụng AI có thể tiêu thụ khoảng 100 TWh điện hàng năm, tương đương với ngành đào Bitcoin

📌 BitEnergy AI phát triển phương pháp Linear-complexity multiplication giúp giảm 95% năng lượng tiêu thụ cho AI. Tuy nhiên cần phần cứng chuyên dụng mới thay thế GPU hiện tại. ChatGPT hiện tiêu thụ 564 MWh điện/ngày và dự kiến toàn ngành AI sẽ tiêu thụ 100 TWh điện/năm trong tương lai gần.

https://www.techradar.com/pro/this-new-method-could-reduce-the-energy-needs-of-ai-applications-by-95

Không có file đính kèm.

Nguồn tham khảo

139

AI chips-hardware-compute 2024-11-27 06:21:43

Kế hoạch tham vọng của Amazon: Chi 8 tỷ USD đầu tư vào chip AI để cạnh tranh với Nvidia

- Amazon đang nỗ lực giành thị phần trong thị trường chip AI trị giá hơn 100 tỷ USD do Nvidia thống trị

- Tại phòng thí nghiệm ở Austin, Texas, đội ngũ kỹ sư Amazon đang phát triển thế hệ chip AI mới nhất - Trainium2

- Rami Sinno, kỹ sư gốc Lebanon, đang chịu trách nhiệm thiết kế và thử nghiệm chip, với mục tiêu đưa Trainium2 vào hoạt động ổn định trong các trung tâm dữ liệu vào cuối năm nay

- Amazon đã triển khai nhiều chip AI nhất trong số các nhà cung cấp điện toán đám mây lớn (AWS, Microsoft Azure, Google Cloud Platform)

- James Hamilton, phó chủ tịch cấp cao của Amazon, là người thuyết phục Jeff Bezos bắt đầu sản xuất chip từ 10 năm trước

- Amazon đã mua lại startup Annapurna Labs với giá 350 triệu USD vào năm 2015 để phát triển chip cho trung tâm dữ liệu

- Trainium2 có hiệu suất gấp 4 lần và bộ nhớ gấp 3 lần so với thế hệ trước

- Amazon đã bắt đầu chuyển Trainium2 đến các trung tâm dữ liệu ở Ohio, với kế hoạch kết nối thành cụm lên đến 100.000 chip

- Anthropic, đối tác của Amazon, đã nhận được khoản đầu tư 8 tỷ USD và cam kết sử dụng chip Trainium cho phát triển trong tương lai

- Thách thức lớn nhất là phát triển phần mềm Neuron SDK để dễ dàng sử dụng như bộ công cụ của Nvidia

📌 Amazon đang đẩy mạnh cuộc đua chip AI với Nvidia thông qua Trainium2 có hiệu suất gấp 4 lần thế hệ trước, đầu tư 8 tỷ USD vào Anthropic và mục tiêu kết nối 100.000 chip thành cụm. Tuy nhiên, họ cần cải thiện phần mềm Neuron SDK để thu hút khách hàng từ Nvidia.

https://www.bloomberg.com/news/features/2024-11-24/amazon-plans-to-rival-nvidia-with-its-own-ai-chips

Không có file đính kèm.

Nguồn tham khảo

104

AI chips-hardware-compute Semi-Cloud-DC-Green 2024-11-24 11:09:04

Trung tâm dữ liệu cho AI có thể tiêu thụ điện hơn cả một thành phố

- Nhu cầu năng lượng của trung tâm dữ liệu phục vụ trí tuệ nhân tạo đang gia tăng mạnh mẽ, có thể vượt qua mức tiêu thụ điện của một số thành phố lớn tại Mỹ.
- Các nhà phát triển trung tâm dữ liệu cho biết năng lượng tiêu thụ của họ có thể đạt tới 1 gigawatt, tương đương với tiêu thụ điện hàng năm của khoảng 700.000 hộ gia đình.
- Thực tế hiện tại cho thấy năng lượng tái tạo chưa đủ để đáp ứng nhu cầu điện năng ngày càng tăng của các trung tâm dữ liệu, buộc phải sử dụng khí tự nhiên.
- Các công ty như Amazon Web Services tại Virginia đang yêu cầu một lượng điện năng tương đương với sản lượng của nhiều lò phản ứng hạt nhân.
- Họ cho rằng việc duy trì năng lượng ổn định cho trung tâm dữ liệu là vấn đề quan trọng, ảnh hưởng đến an ninh kinh tế và quốc gia.
- Trung tâm dữ liệu đang mở rộng ra ngoài Virginia vào các khu vực mới như Arizona và Nevada do hạn chế về đất đai và điện năng.
- Một trung tâm dữ liệu có công suất 1 gigawatt tương đương với tiêu thụ điện của thành phố khoảng 1,8 triệu dân.
- Các công ty công nghệ lớn đang chuyển hướng sang các nguồn năng lượng đáng tin cậy hơn như năng lượng hạt nhân để giảm phụ thuộc vào khí đốt tự nhiên.
- Mặc dù có sự chuyển hướng, nhưng việc xây dựng các nhà máy điện hạt nhân mới thường gặp khó khăn về chi phí và thời gian.
- Ngành công nghiệp đang hướng tới việc giảm thiểu tác động môi trường thông qua các công nghệ mới như lưu trữ năng lượng và thu hồi carbon.

📌 Nhu cầu năng lượng của trung tâm dữ liệu phục vụ trí tuệ nhân tạo hiện đang vượt qua mức tiêu thụ của nhiều thành phố, với công suất lên tới 1 gigawatt, trong khi năng lượng tái tạo không đủ đáp ứng. Các công ty đang phải dựa vào khí tự nhiên và tìm kiếm các giải pháp năng lượng bền vững hơn trong tương lai.

https://www.cnbc.com/2024/11/23/data-centers-powering-ai-could-use-more-electricity-than-entire-cities.html

Không có file đính kèm.

Nguồn tham khảo

125

AI chips-hardware-compute 2024-11-22 00:40:49

Nhật Bản đầu tư 65 tỷ USD vào AI và chip, nhằm khôi phục vị thế công nghệ toàn cầu

- Nhật Bản chuẩn bị gói đầu tư 10 nghìn tỷ yên (tương đương 65 tỷ USD) vào chip bán dẫn và AI, dự kiến được phê duyệt trong tuần này

- Gói đầu tư nhằm hai mục tiêu chính:
+ Lấy lại vị thế dẫn đầu công nghệ toàn cầu
+ Đối phó với thách thức từ dân số già và suy giảm

- SoftBank và Nvidia vừa công bố kế hoạch xây dựng "lưới AI" trên toàn quốc, bao gồm siêu máy tính sử dụng chip AI Blackwell mới nhất

- Microsoft cũng đã đầu tư vào Nhật Bản đầu năm nay, hợp tác với OpenAI

- Chính phủ cam kết hỗ trợ 4 nghìn tỷ yên để tăng gấp ba doanh số chip sản xuất trong nước vào năm 2030

- TSMC đã khai trương nhà máy chip trị giá 8,6 tỷ USD tại Nhật Bản vào tháng 2/2024 và lên kế hoạch xây dựng cơ sở thứ hai

- Thách thức chính là nguồn năng lượng:
+ Nhật Bản phụ thuộc nhiều vào nhiên liệu hóa thạch nhập khẩu
+ Các nhà máy chip và trung tâm dữ liệu AI tiêu thụ nhiều điện
+ Tại Đài Loan, TSMC chiếm 8% lượng điện tiêu thụ

- Luật bản quyền Nhật Bản thân thiện với AI, cho phép các công ty AI đào tạo trên dữ liệu có bản quyền

- Thủ tướng Shigeru Ishiba cam kết thu hút hơn 50 nghìn tỷ yên đầu tư công-tư trong 10 năm tới cho AI và chip

📌 Nhật Bản đang đặt cược lớn vào công nghệ với 65 tỷ USD cho AI và chip, nhưng đối mặt thách thức về năng lượng. TSMC đã đầu tư 8,6 tỷ USD vào nhà máy đầu tiên, trong khi luật pháp thân thiện với AI tạo môi trường thuận lợi cho phát triển công nghệ.

https://www.dawn.com/news/1873651

Không có file đính kèm.

Nguồn tham khảo

143

AI chips-hardware-compute 2024-11-22 00:35:12

Nvidia đứng trước áp lực khi các mô hình AI đối mặt với "bức tường" kỹ thuật

- Hội nghị thượng đỉnh về an toàn AI mới nhất đang diễn ra tại San Francisco, cùng với cuộc họp đầu tiên của Mạng lưới quốc tế các viện an toàn AI

- Các chuyên gia trong ngành AI đang thảo luận về sự chậm lại trong phát triển công nghệ, đặc biệt là trong việc huấn luyện mô hình ngôn ngữ lớn (LLM)

- Ilya Sutskever, đồng sáng lập OpenAI, nhận định kết quả huấn luyện AI đã đạt đến điểm bão hòa

- Các phòng thí nghiệm AI lớn như Google và Anthropic đang gặp khó khăn trong việc phát triển mô hình vượt trội hơn GPT-4 của OpenAI

- Các nhà sáng lập Andreessen Horowitz cũng ghi nhận sự suy giảm trong khả năng cải thiện của các mô hình AI

- Vấn đề cơ sở hạ tầng đang nổi lên: thiếu chip, thiếu năng lượng và khó khăn trong việc làm mát thiết bị

- Nvidia báo cáo khách hàng lo ngại về tình trạng quá nhiệt của GPU Blackwell khi kết nối thành cụm để cải thiện việc huấn luyện AI

- Cổ phiếu Nvidia đã tăng 190% trong năm nay, thu hút sự chú ý đặc biệt của nhà đầu tư

- Sam Altman, CEO OpenAI, phủ nhận việc AI đang chậm lại, khẳng định "không có bức tường nào"

- Eric Schmidt, cựu CEO Google, dự đoán sẽ có 2-3 bước tiến mới trong phát triển các mô hình lớn trong 5 năm tới

📌 Ngành công nghiệp AI đang đối mặt với thách thức kỹ thuật nghiêm trọng. Cổ phiếu Nvidia tăng 190% năm 2024 nhưng đang chịu áp lực lớn. Các công ty công nghệ lớn gặp khó trong việc cải thiện mô hình AI do hạn chế về hạ tầng và kỹ thuật.

https://www.thetimes.com/business-money/companies/article/all-eyes-on-nvidia-as-the-race-to-build-next-ai-model-hits-a-wall-vdwpnh582

Không có file đính kèm.

Nguồn tham khảo

119

AI chips-hardware-compute AI nghiên cứu 2024-11-22 00:32:24

NVIDIA tiết lộ công nghệ AI đột phá có thể thay đổi tương lai khoa học tại SC24

- Jensen Huang, CEO NVIDIA tuyên bố tại SC24 về vai trò quan trọng của siêu máy tính trong các đột phá khoa học và mở rộng tri thức nhân loại

- NVIDIA đã giảm chi phí điện toán xuống 1 triệu lần kể từ khi ra mắt CUDA năm 2006

- Công ty giới thiệu thư viện cuPyNumeric mới - phiên bản GPU tăng tốc của NumPy cho khoa học dữ liệu và học máy

- NVIDIA Omniverse Blueprint ra mắt quy trình tham chiếu giúp phát triển digital twin tương tác thời gian thực, tăng tốc mô phỏng lên đến 1.200 lần

- Công nghệ CUDA-Q hợp tác với Google giúp giảm thời gian tính toán mô phỏng lượng tử từ nhiều tuần xuống còn vài phút

- BioNeMo Framework nguồn mở tăng tốc huấn luyện gấp 2 lần trong phát triển thuốc

- DiffDock 2.0 nhanh hơn 6 lần so với phiên bản cũ trong dự đoán liên kết thuốc-protein

- Microservice ALCHEMI NIM ứng dụng AI tạo sinh trong hóa học để thiết kế và đánh giá vật liệu mới

- Earth-2 với hai microservice mới CorrDiff NIM và FourCastNet NIM tăng tốc mô hình hóa khí hậu lên 500 lần

- Hợp tác với Foxconn mở rộng sản xuất tại Mỹ, Mexico và Đài Loan

- GPU H200 NVL tăng tốc suy luận mô hình ngôn ngữ lớn lên 1,7 lần

- GB200 Grace Blackwell NVL4 Superchip tích hợp 4 GPU Blackwell, hiệu năng tăng gấp 2 lần, dự kiến ra mắt nửa sau 2025

📌 NVIDIA định hình lại tương lai khoa học với loạt đột phá công nghệ AI: tăng tốc mô phỏng lên 1.200 lần, giảm thời gian tính toán lượng tử từ tuần xuống phút, tăng tốc dự báo khí hậu 500 lần. Foxconn sẽ mở rộng sản xuất tại 3 quốc gia, GB200 Superchip mới có hiệu năng gấp đôi sẽ ra mắt 2025.

https://blogs.nvidia.com/blog/supercomputing-24/

Không có file đính kèm.

Nguồn tham khảo

140

AI chips-hardware-compute Semi-Cloud-DC-Green 2024-11-20 01:02:29

Không chỉ trung tâm dữ liệu - Hạ tầng mạng cho AI cần được nâng cấp khẩn cấp với chi phí khổng lồ

- Làn sóng sử dụng AI sắp tới sẽ tạo áp lực lên khả năng mạng quốc gia, không chỉ ảnh hưởng đến trung tâm dữ liệu và lưới điện

- Thị trường mạng trung tâm dữ liệu toàn cầu trị giá 34,61 tỷ USD dự kiến đạt 118,94 tỷ USD vào năm 2033

- Đầu tư của doanh nghiệp vào switch trung tâm dữ liệu AI dự kiến tăng từ 127,2 triệu USD năm 2024 lên 1 tỷ USD vào năm 2027

- XAI của Elon Musk đã xây dựng cụm siêu máy tính với 100.000 GPU Nvidia tại Memphis chỉ trong 122 ngày

- Switch sẵn sàng cho AI có giá cao gấp 5 lần so với switch trung tâm dữ liệu truyền thống

- Nvidia cung cấp nền tảng mạng InfiniBand để di chuyển dữ liệu lớn giữa các GPU Nvidia

- Microsoft và Amazon đã chi hàng tỷ USD để xây dựng trung tâm dữ liệu riêng với GPU và mạng sẵn sàng cho AI

- Lumen đã ký thỏa thuận 5 tỷ USD để cung cấp kết nối cáp quang cho trung tâm dữ liệu AI của Microsoft

- Các công ty lớn sẽ bắt đầu xây dựng trung tâm dữ liệu riêng để huấn luyện và vận hành AI trong vài năm tới

- Infosys đã có cụm GPU riêng để xây dựng và huấn luyện các mô hình AI nhỏ và trung bình

📌 Nhu cầu nâng cấp hạ tầng mạng cho AI đang tăng mạnh với dự báo đạt 118,94 tỷ USD vào 2033. Các công ty công nghệ lớn đã đầu tư hàng tỷ USD, trong khi chi phí thiết bị mạng AI cao gấp 5 lần thiết bị thông thường. Xu hướng xây dựng trung tâm dữ liệu AI riêng sẽ tiếp tục tăng trong những năm tới.

https://www.wsj.com/articles/it-isnt-just-data-centersais-plumbing-needs-an-upgrade-2571425d

#WSJ

Không có file đính kèm.

Nguồn tham khảo

119

AI chips-hardware-compute 2024-11-19 07:26:56

Cerebras phá vỡ kỷ lục thế giới: Tốc độ xử lý AI nhanh hơn 700 lần so với siêu máy tính mạnh nhất

- Cerebras đã đạt được thành tích vượt trội trong việc xử lý suy luận mô hình Llama-3.1 405B, tạo ra 970 token mỗi giây

- Hiệu năng của Cerebras cao hơn:
+ 12 lần so với GPU nhanh nhất
+ 6 lần so với đối thủ SambaNova
+ Gấp đôi tốc độ của GPU cloud khi chạy mô hình 1B

- Chi phí xử lý:
+ 6 USD/triệu token đầu vào
+ 12 USD/triệu token đầu ra
+ Giá một hệ thống CS3: 2-3 triệu USD

- Ưu điểm công nghệ:
+ Sử dụng bộ nhớ SRAM trên chip
+ Băng thông bộ nhớ cao hơn 7.000 lần so với Nvidia H100
+ Độ trễ token đầu tiên chỉ bằng 1/2 so với Google Vertex

- Trong lĩnh vực mô phỏng động học phân tử:
+ Đạt 1,2 triệu bước mô phỏng/giây
+ Nhanh hơn 700 lần so với siêu máy tính Frontier
+ Rút ngắn thời gian mô phỏng từ 2 năm xuống còn 1 ngày

📌 Cerebras đã tạo ra bước đột phá với tốc độ xử lý 970 token/giây cho mô hình Llama-3.1 405B, nhanh hơn 12 lần so với GPU và 700 lần so với siêu máy tính Frontier trong mô phỏng động học phân tử. Công nghệ này mở ra tiềm năng mới cho AI đa tác vụ và suy luận chuỗi.

https://www.forbes.com/sites/karlfreund/2024/11/18/cerebras-now-the-fastest-llm-inference-processor--its-not-even-close

Không có file đính kèm.

Nguồn tham khảo

104

AI market AI chips-hardware-compute 2024-11-18 07:59:48

Thuế quan chip Đài Loan của Trump có thể gây tổn thất hàng tỷ USD cho ngành AI

- Tổng thống đắc cử Donald Trump đề xuất áp thuế quan lên hàng nhập khẩu, đặc biệt là chip từ Đài Loan thay vì thực hiện CHIPS Act

- Trump chỉ trích CHIPS Act - đạo luật được Biden ký năm 2022 nhằm đưa sản xuất bán dẫn về Mỹ là "rất tệ"

- Mức thuế dự kiến:
+ 10-20% cho tất cả hàng nhập khẩu
+ 60% cho hàng hóa từ Trung Quốc
+ Chưa công bố mức thuế cụ thể cho chip Đài Loan

- Thống kê năm 2021:
+ 44% chip logic nhập khẩu vào Mỹ đến từ Đài Loan
+ Nếu gián đoạn sản xuất, giá chip logic có thể tăng tới 59%

- Tác động tiềm tàng:
+ Ảnh hưởng đến biên lợi nhuận của Nvidia và AMD
+ Chi phí có thể được chuyển cho người tiêu dùng cuối
+ TSMC đang xây nhà máy ở Arizona, thuế quan có thể làm phức tạp thêm tiến trình

- Ý kiến chuyên gia:
+ Dan Newman (CEO Futurum Group): Trump khó thực hiện chính sách gây tổn hại kinh tế
+ Lori Yue (Đại học Columbia): Khả năng cao Trump sẽ áp thuế chip
+ Việc nới lỏng quy định AI dưới thời Trump có thể bù đắp tác động từ tăng giá

- Các công ty có thể chuyển sang sử dụng cơ sở sản xuất của Intel tại Mỹ

📌 Chính sách thuế quan chip Đài Loan của Trump có thể làm tăng 59% giá chip logic, ảnh hưởng trực tiếp đến 44% nguồn cung chip của Mỹ. Điều này tác động mạnh đến ngành AI và các "gã khổng lồ" như Nvidia, AMD, buộc họ tìm kiếm nguồn cung thay thế từ Intel.

https://finance.yahoo.com/news/how-the-trump-tariffs-on-taiwan-chips-could-hurt-the-ai-trade--and-the-likes-of-nvidia-153010013.html

Không có file đính kèm.

Nguồn tham khảo

120

AI chips-hardware-compute 2024-11-18 07:56:05

GPU Blackwell của Nvidia gặp vấn đề quá nhiệt nghiêm trọng, buộc phải thiết kế lại giá đỡ máy chủ

- GPU Blackwell thế hệ mới của Nvidia đang đối mặt với vấn đề quá nhiệt nghiêm trọng khi lắp đặt trong giá đỡ máy chủ công suất cao

- Theo nguồn tin nội bộ, các GPU này gặp vấn đề khi sử dụng trong máy chủ chứa 72 bộ xử lý, với mức tiêu thụ điện lên đến 120kW mỗi giá đỡ

- Nvidia đã phải nhiều lần đánh giá lại thiết kế giá đỡ máy chủ do tình trạng quá nhiệt ảnh hưởng đến hiệu suất GPU và có nguy cơ gây hỏng linh kiện

- Công ty đã yêu cầu các nhà cung cấp thực hiện nhiều thay đổi về thiết kế để khắc phục vấn đề quá nhiệt

- Trước đó, Nvidia đã phải trì hoãn sản xuất Blackwell do lỗi thiết kế ảnh hưởng đến năng suất

- GPU B100 và B200 sử dụng công nghệ đóng gói CoWoS-L của TSMC để kết nối hai chiplet, hỗ trợ tốc độ truyền dữ liệu lên đến 10 TB/giây

- Sự không phù hợp về đặc tính giãn nở nhiệt giữa các chiplet GPU, cầu nối LSI và các thành phần khác dẫn đến biến dạng và lỗi hệ thống

- Phiên bản cuối cùng của GPU Blackwell mới bắt đầu sản xuất hàng loạt vào cuối tháng 10/2023

- Các khách hàng lớn như Google, Meta và Microsoft sử dụng GPU của Nvidia để huấn luyện các mô hình ngôn ngữ lớn mạnh nhất

📌 GPU Blackwell của Nvidia gặp khủng hoảng quá nhiệt với mức tiêu thụ 120kW/giá đỡ, buộc phải thiết kế lại nhiều lần và trì hoãn sản xuất từ tháng 10/2023, ảnh hưởng nghiêm trọng đến kế hoạch của các khách hàng lớn như Google, Meta, Microsoft.

https://www.tomshardware.com/pc-components/gpus/nvidias-data-center-blackwell-gpus-reportedly-overheat-require-rack-redesigns-and-cause-delays-for-customers

Không có file đính kèm.

Nguồn tham khảo

116

AI chips-hardware-compute Semi-Cloud-DC-Green 2024-11-16 08:32:51

Trung tâm dữ liệu AI sẽ đòi hỏi đầu tư khổng lồ 100 tỷ USD từ 2027

- CEO Anthropic Dario Amodei dự báo quy mô đầu tư trung tâm dữ liệu AI sẽ tăng mạnh trong các năm tới

- Hiện tại, các công ty AI hàng đầu đang vận hành ở quy mô khoảng 1 tỷ USD

- Dự kiến đầu tư sẽ tăng lên vài tỷ USD trong năm 2025, trên 10 tỷ USD năm 2026 và đạt 100 tỷ USD từ năm 2027

- OpenAI đã công khai kế hoạch xây dựng trung tâm dữ liệu 100 tỷ USD với công suất 5GW, diện tích 2.787.100m2 và 2 triệu GPU

- Microsoft sẽ thuê trung tâm dữ liệu 1GW tại Texas do Crusoe xây dựng và Oracle sử dụng

- Anthropic đã huy động được 2,3 tỷ USD từ Google và 4 tỷ USD từ AWS

- AWS đang xem xét đầu tư thêm 1 tỷ USD vào Anthropic và yêu cầu công ty sử dụng chip Trainium

- AWS hiện đang xây dựng khu trung tâm dữ liệu trị giá 10 tỷ USD tại Quận Madison, Mississippi

- AWS cam kết đầu tư 100 tỷ USD vào trung tâm dữ liệu trong thập kỷ tới

- OpenAI và Google nhận thấy có giới hạn về quy mô - việc tăng năng lực tính toán cùng dữ liệu và mạng lưới không phải lúc nào cũng dẫn đến mô hình tốt hơn

📌 Các công ty AI đang chạy đua đầu tư hạ tầng với quy mô chưa từng có: từ 1 tỷ USD hiện tại lên 100 tỷ USD vào 2027. AWS dẫn đầu với cam kết 100 tỷ USD trong 10 năm tới. Tuy nhiên, việc mở rộng quy mô đang gặp thách thức về hiệu quả và giới hạn kỹ thuật.

https://www.datacenterdynamics.com/en/news/anthropic-ceo-ai-training-data-centers-to-be-10bn-in-2026-100bn-from-2027/

Không có file đính kèm.

Nguồn tham khảo

138

AI chips-hardware-compute 2024-11-16 08:26:06

Bí mật đằng sau sức mạnh của Nvidia: Từ hàng giờ xuống vài giây với tính toán song song

- Tại hội nghị khoa học dữ liệu ở Manhattan đầu tháng 11, gian hàng Nvidia thu hút đông đảo người quan tâm đến khả năng tính toán song song

- Nvidia sản xuất GPU (graphics processing units), các chip máy tính có khả năng xử lý nhiều tác vụ cùng lúc, khác với CPU thông thường chỉ xử lý từng tác vụ một

- Rick Ratzel, quản lý kỹ thuật của Nvidia đã thực hiện demo về khả năng xử lý dữ liệu của GPU:
+ Phân tích bộ dữ liệu đánh giá phim với 330.000 người dùng
+ Thời gian xử lý bằng CPU truyền thống: 2 giờ
+ Sau khi tối ưu hóa còn 1 giờ
+ Khi chuyển sang GPU: chỉ mất chưa đầy 2 giây

- Tính toán song song đã có từ thập niên 1980 nhưng gần đây mới phổ biến nhờ:
+ GPU dễ tiếp cận hơn thông qua các nhà cung cấp điện toán đám mây
+ Các nhà khoa học dữ liệu có thể thực hiện nhiều thử nghiệm hơn
+ Tiết kiệm thời gian đáng kể cho các dự án

- GPU của Nvidia đóng vai trò quan trọng trong:
+ Xây dựng và vận hành các mô hình AI như GPT-4 của OpenAI
+ Tối ưu hóa chuỗi cung ứng
+ Phát hiện gian lận trực tuyến
+ Quảng cáo internet phù hợp

📌 Nvidia đã trở thành công ty giá trị nhất thế giới nhờ công nghệ GPU cho phép tính toán song song, giúp rút ngắn thời gian xử lý dữ liệu từ hàng giờ xuống còn vài giây. Khả năng này đặc biệt quan trọng trong kỷ nguyên AI, khi việc xử lý khối lượng dữ liệu khổng lồ trở nên thiết yếu.

https://www.businessinsider.com/nvidia-gpus-cpus-parallel-computing-2024-11

Không có file đính kèm.

Nguồn tham khảo

123

AI chips-hardware-compute Semi-Cloud-DC-Green 2024-11-16 08:04:40

Bi kịch ở Mexico: Khi người dân khát nước, Microsoft dùng nước để làm mát DC AI

• Thị trấn Colón với 67.000 dân đang phải đối mặt với hạn hán nghiêm trọng, 2 đập nước gần như cạn kiệt[1].

• Microsoft đã xây dựng trung tâm dữ liệu hyperscale đầu tiên tại Mexico, đầu tư hàng tỷ USD vào bang Querétaro.

• Các trung tâm dữ liệu cần lượng lớn nước sạch để làm mát thiết bị. Google tăng 20% lượng nước sử dụng năm 2022, Microsoft tăng 34%.

• Người dân địa phương phụ thuộc vào nước đóng chai và xe bồn chở nước. Một chủ nhà hàng phải vác nước từ nhà đến quán cách 8 ngày/lần.

• Các công ty công nghệ không minh bạch về lượng nước sử dụng. Microsoft từ chối cung cấp thông tin, Amazon tuyên bố công nghệ không cần nước.

• Dự án chỉ tạo ra 2.000 việc làm trực tiếp, chủ yếu dành cho người có bằng Thạc sĩ/Tiến sĩ từ Mexico City.

• Nông dân địa phương như ông Guadalupe Hernández không hiểu AI là gì nhưng biết rõ về bất bình đẳng nguồn nước khi mùa màng thiệt hại.

• Chính phủ Mexico ưu tiên thu hút các công ty công nghệ nhưng thiếu minh bạch và trách nhiệm giải trình về tác động môi trường.

📌 Microsoft đầu tư tỷ USD vào trung tâm dữ liệu AI tại Mexico, tiêu thụ lượng nước lớn trong bối cảnh hạn hán nghiêm trọng. Người dân địa phương thiếu nước sinh hoạt và sản xuất, trong khi các công ty công nghệ không minh bạch về mức độ sử dụng nguồn nước công cộng.

https://inthesetimes.com/article/microsoft-ai-data-center-water-climate

Không có file đính kèm.

Nguồn tham khảo

118

AI chips-hardware-compute Semi-Cloud-DC-Green 2024-11-14 07:45:05

150MW điện cho trung tâm dữ liệu AI khổng lồ xAI, cho phép vận hành đồng thời 100.000 GPU

- Tennessee Valley Authority đã phê duyệt cung cấp 150MW điện cho trung tâm dữ liệu xAI của Elon Musk vào đầu tháng 11, tăng gấp 20 lần so với nguồn cung ban đầu 8MW

- Trung tâm dữ liệu này được xây dựng trong thời gian kỷ lục 19 ngày, so với thông thường mất 4 năm theo CEO Nvidia Jensen Huang

- Để vận hành 100.000 GPU đồng thời, xAI cần khoảng 155MW điện. Mức yêu cầu 150MW được xem là khá thận trọng

- Memphis Light, Gas & Water (MLGW) đã nâng cấp trạm biến áp lên 50MW trong mùa hè, nhưng vẫn chưa đủ để vận hành toàn bộ GPU

- Luật sư Amanda Garcia từ Southern Environmental Law Center bày tỏ lo ngại về việc TVA phê duyệt mà không nghiên cứu kỹ tác động đến cộng đồng địa phương

- CEO Doug McGowen của MLGW khẳng định nhu cầu điện của xAI vẫn nằm trong dự báo tải đỉnh và có thể mua thêm điện từ TVA nếu cần

- Các chuyên gia dự đoán trung tâm dữ liệu trong tương lai sẽ cần đến hàng gigawatt điện để huấn luyện mô hình AI

- Nhiều công ty công nghệ lớn như Amazon, Google, Microsoft và Oracle đang đầu tư vào năng lượng hạt nhân, nhưng phải mất 5 năm hoặc lâu hơn để triển khai

📌 Trung tâm dữ liệu AI của Elon Musk được cấp 150MW điện, đủ vận hành 100.000 GPU đồng thời. Dự án hoàn thành trong 19 ngày với nhiều lo ngại về tác động môi trường. Các công ty công nghệ lớn đang hướng đến năng lượng hạt nhân như giải pháp tương lai.

https://www.tomshardware.com/tech-industry/artificial-intelligence/elon-musks-massive-ai-data-center-gets-unlocked-xai-gets-approved-for-150mw-of-power-enabling-all-100-000-gpus-to-run-concurrently

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute AI viễn thông 2024-11-13 17:31:05

Nhà mạng SoftBank nhận chip Nvidia Blackwell đầu tiên cho siêu máy tính AI

- SoftBank Corp sẽ nhận chip mới nhất từ thiết kế Blackwell của Nvidia cho siêu máy tính, theo thông báo từ hãng chip có trụ sở tại California.
- Masayoshi Son, CEO của SoftBank, đang tìm cách mở rộng ảnh hưởng của tập đoàn trong lĩnh vực trí tuệ nhân tạo (AI).
- Nvidia đã tổ chức một sự kiện AI tại Tokyo với sự tham gia của Son và Jensen Huang, CEO của Nvidia.
- Son đã đầu tư vào OpenAI và mua lại Graphcore, nhằm nâng cao vị thế của SoftBank trong lĩnh vực AI sau những năm khó khăn.
- Huang chia sẻ rằng Son đã từng đề nghị cho ông vay tiền để mua Nvidia khi giá trị của công ty chưa được thị trường đánh giá đúng.
- Đề nghị này được đưa ra sau khi Son mua lại công ty thiết kế chip Arm, nhưng sau đó ông đã bán bớt cổ phần Nvidia và gặp khó khăn trong việc bán Arm cho Nvidia do rào cản quy định.
- Nvidia, trước đây nổi tiếng với các chip đồ họa cho game, đã trở thành công ty giá trị nhất thế giới nhờ nhu cầu không ngừng cho các chip của mình.
- SoftBank đang hợp tác với Nvidia để thử nghiệm một mạng lưới có thể vận hành cả dịch vụ 5G và AI, nhằm tìm kiếm động lực tăng trưởng mới trong bối cảnh ngành viễn thông toàn cầu.
- Son cho biết ông cảm nhận được sự tương đồng giữa mình và Huang, trong khi Huang hài hước phản ứng rằng ông không thích hình ảnh con chó con mà Son miêu tả.

📌 SoftBank nhận chip Blackwell đầu tiên từ Nvidia cho siêu máy tính, đánh dấu bước tiến lớn trong lĩnh vực trí tuệ nhân tạo. Sự kiện diễn ra tại Tokyo với sự tham gia của Masayoshi Son và Jensen Huang, nhấn mạnh tầm quan trọng của AI trong tương lai công nghệ.

https://www.reuters.com/business/media-telecom/nvidia-softbank-pilot-worlds-first-ai-5g-telecom-network-2024-11-13/

Không có file đính kèm.

Nguồn tham khảo

118

AI chips-hardware-compute 2024-11-10 10:38:07

Jensen Huang của NVIDIA: “Chúng ta đang bước vào kỷ nguyên Hyper Moore’s Law”

- Jensen Huang, giám đốc NVIDIA, khẳng định thời kỳ mở rộng chip truyền thống đang dần kết thúc, dẫn đến sự xuất hiện của "Hyper Moore’s Law."
- Ông nhấn mạnh rằng sự chuyển mình này đánh dấu một kỷ nguyên mới trong công nghệ máy tính, vượt ra ngoài mô hình cải tiến hiệu suất chip thông thường.
- Moore’s Law trước đây dựa vào việc mở rộng Dennard và các kỹ thuật VLSI của Carver Mead để tăng cường hiệu suất chip nhưng đã đạt đến giới hạn.
- Huang cho biết rằng cả hai kỹ thuật này đã không còn hiệu quả, và ngành công nghiệp cần phương pháp mới để phát triển.
- Ông đề xuất phương pháp "codesign," tức là phát triển đồng thời phần cứng và phần mềm để tối ưu hóa hiệu suất.
- Phương pháp này cho phép những đổi mới về độ chính xác trong tính toán, với sự chuyển đổi từ các phép toán số thực như FP64 xuống FP32 và thậm chí FP4.
- Huang cũng nhấn mạnh vai trò quan trọng của trung tâm dữ liệu trong sự phát triển này, với các chiến lược mở rộng sáng tạo và toàn diện.
- Trong năm nay, khi NVIDIA phát hành Blackwell, đã có ý kiến cho rằng Moore’s Law không còn tồn tại.
- Ông nêu rõ rằng trong vòng 8 năm qua, NVIDIA đã tăng gấp một nghìn lần sức mạnh tính toán, một bước tiến vượt bậc so với các tiêu chuẩn trước đây của Moore’s Law.
- Tuy nhiên, Huang cũng bày tỏ lo lắng vì nhu cầu của ngành công nghiệp vẫn chưa được đáp ứng đầy đủ, mặc dù có sự tăng trưởng ấn tượng về sức mạnh tính toán.

📌 Jensen Huang từ NVIDIA cho biết rằng "Hyper Moore's Law" sẽ dẫn dắt công nghệ máy tính, với sự phát triển gấp 1000 lần trong 8 năm qua, nhưng nhu cầu hiện tại vẫn chưa được đáp ứng.

https://analyticsindiamag.com/ai-news-updates/nvidias-jensen-huang-says-that-we-are-in-the-era-of-hyper-moores-law/

Không có file đính kèm.

Nguồn tham khảo

137

AI chips-hardware-compute 2024-11-09 08:19:09

Cú trượt dài của Samsung: Mất 126 tỷ USD vì tụt hậu công nghệ bộ nhớ HBM cho AI

- Samsung Electronics đã mất vị trí dẫn đầu trong lĩnh vực bộ nhớ bán dẫn vào tay đối thủ SK Hynix, dẫn đến thiệt hại 126 tỷ USD vốn hóa thị trường

- Bộ nhớ băng thông cao (HBM) là thành phần quan trọng trong kiến trúc chip của Nvidia dùng để huấn luyện các mô hình AI lớn

- Samsung đã không đầu tư đúng mức vào HBM vì coi đây là sản phẩm thị trường ngách với chi phí phát triển cao

- SK Hynix đã nắm bắt cơ hội, tích cực phát triển chip HBM và được Nvidia phê duyệt sử dụng, thiết lập mối quan hệ chặt chẽ với công ty Mỹ

- Trong quý 3/2024, SK Hynix đạt lợi nhuận hoạt động kỷ lục nhờ thành công với HBM

- Samsung cho biết doanh số HBM tăng hơn 70% so với quý trước, sản phẩm HBM3E đang sản xuất hàng loạt

- Samsung đang phát triển HBM4 thế hệ tiếp theo, dự kiến sản xuất hàng loạt vào nửa sau 2025

- Khả năng phục hồi ngắn hạn của Samsung phụ thuộc vào việc được Nvidia phê duyệt làm nhà cung cấp HBM

- Samsung cho biết đã hoàn thành giai đoạn quan trọng trong quá trình đánh giá và kỳ vọng mở rộng doanh số từ quý 4/2024

📌 Samsung mất 126 tỷ USD vốn hóa do chậm đầu tư vào bộ nhớ HBM - công nghệ then chốt cho chip AI. SK Hynix vượt lên nhờ hợp tác sớm với Nvidia. Samsung kỳ vọng phục hồi từ Q4/2024 sau khi hoàn tất quá trình phê duyệt của Nvidia.

https://www.cnbc.com/2024/11/08/how-samsung-fell-behind-in-the-ai-boom-behind-rival-sk-hynix.html

Không có file đính kèm.

Nguồn tham khảo

108

AI chips-hardware-compute 2024-11-04 06:24:37

Vì sao Nvidia đổi tên dòng sản phẩm flagship Blackwell Ultra?

- Nvidia vừa đổi tên dòng sản phẩm flagship Blackwell Ultra, trong đó B200 Ultra thành B300 và GB200 Ultra thành GB300

- Dự kiến dòng B300 sẽ ra mắt trong khoảng quý 2-3/2025, trong khi B200 và GB200 bắt đầu xuất xưởng từ quý 4/2024

- B300A nhắm đến đối tượng OEM, sản xuất từ quý 2/2025 khi dòng H200 giảm dần sản lượng

- Theo TrendForce, việc chuyển từ kế hoạch B200A sang B300A cho thấy nhu cầu GPU hạ cấp thấp hơn dự kiến

- Nvidia đang đầu tư cải thiện giải pháp NVL rack, hỗ trợ nhà cung cấp hệ thống server tối ưu hiệu năng và làm mát cho NVL72

- Thị phần GPU cao cấp của Nvidia dự kiến đạt 50% trong 2024, tăng 20% so với năm trước và có thể lên 65% vào 2025 nhờ nền tảng Blackwell

- Nhu cầu công nghệ CoWoS dự báo tăng 10% so với cùng kỳ khi Nvidia tập trung cung cấp B300 và GB300 cho các CSP lớn ở Bắc Mỹ

- Nvidia sẽ chiếm hơn 70% thị trường HBM toàn cầu trong năm tới, tăng 10% hàng năm

- Tất cả model B300 sẽ sử dụng HBM3e 12hi, đây là lần đầu Nvidia sản xuất hàng loạt sản phẩm stack 12hi

📌 Nvidia định hướng lại chiến lược sản phẩm Blackwell nhằm thống trị thị trường AI với mục tiêu chiếm 65% thị phần GPU cao cấp vào 2025. Công ty tập trung vào công nghệ CoWoS-L và HBM3e 12hi, dự kiến chiếm 70% thị trường HBM toàn cầu.

https://www.techradar.com/pro/nvidia-has-renamed-its-blackwell-ultra-product-series-heres-why

Không có file đính kèm.

Nguồn tham khảo

132

AI chips-hardware-compute 2024-11-01 07:33:54

Thất bại của Intel: Chip AI Gaudi không đạt mục tiêu, thua lỗ 16,6 tỷ USD trong quý 3/2024

- Intel thông báo không thể đạt mục tiêu doanh thu 500 triệu USD từ chip AI Gaudi trong năm 2024, thấp hơn nhiều so với dự kiến ban đầu là 1-2 tỷ USD

- AMD đã đạt doanh thu 1 tỷ USD mỗi quý từ chip AI, trở thành sản phẩm tăng trưởng nhanh nhất trong lịch sử công ty

- CEO Pat Gelsinger cho biết việc chuyển đổi từ Gaudi 2 sang Gaudi 3 và khó khăn trong sử dụng phần mềm đã ảnh hưởng đến tốc độ áp dụng sản phẩm

- Intel báo cáo doanh thu quý 3/2024 đạt 13,3 tỷ USD, giảm 6% so với cùng kỳ năm trước

- Công ty ghi nhận khoản lỗ 16,6 tỷ USD do chi phí tái cấu trúc và giảm giá trị tài sản 18,5 tỷ USD

- Intel đang thực hiện kế hoạch cắt giảm chi phí 10 tỷ USD và sa thải hơn 15.000 nhân viên

- Công ty tái cơ cấu bằng cách:
+ Chuyển mảng điện toán biên vào nhóm Client Computing
+ Tích hợp các đội phần mềm vào các đơn vị kinh doanh cốt lõi
+ Tập trung vào ít dự án hơn, ưu tiên tối đa hóa giá trị nền tảng x86

📌 Intel đang phải đối mặt với khủng hoảng khi thua lỗ 16,6 tỷ USD trong quý 3/2024, không đạt mục tiêu doanh thu từ chip AI Gaudi và buộc phải tái cấu trúc toàn diện với việc sa thải 15.000 nhân viên, cắt giảm 10 tỷ USD chi phí để duy trì khả năng cạnh tranh.

https://www.theverge.com/2024/10/31/24284860/intel-gaudi-wont-meet-500-million-goal

Không có file đính kèm.

Nguồn tham khảo

152

AI chips-hardware-compute 2024-10-29 07:10:10

Chip AI mới của Cerebras "đánh bại" Nvidia với tốc độ xử lý nhanh gấp 20 lần

• Cerebras Systems, công ty khởi nghiệp tại California, vừa công bố giải pháp Cerebras Inference với tốc độ nhanh gấp 20 lần so với GPU của Nvidia

• Công nghệ đột phá Wafer Scale Engine thế hệ thứ 3 tích hợp:
- 4 nghìn tỷ bóng bán dẫn
- 44GB SRAM tích hợp
- Không cần bộ nhớ ngoài, loại bỏ điểm nghẽn của GPU truyền thống

• Hiệu năng xử lý ấn tượng:
- 1.800 token/giây cho mô hình Llama3.1 8B
- 450 token/giây cho mô hình Llama3.1 70B

• So sánh kiến trúc:
- Cerebras: Thiết kế wafer đơn khối, tích hợp xử lý và bộ nhớ
- Nvidia: Kiến trúc đa chip kết nối qua NVLink, linh hoạt và dễ mở rộng

• Ưu điểm của Cerebras:
- Tốc độ xử lý AI inference vượt trội
- Độ trễ thấp nhờ tích hợp bộ nhớ
- Phù hợp với mô hình AI quy mô lớn

• Ưu điểm của Nvidia:
- Hệ sinh thái phần mềm phong phú
- Đa dụng từ game đến AI
- Khả năng ứng dụng rộng rãi

• AMD và Intel có thể đối mặt với sự cạnh tranh mạnh mẽ khi Cerebras ngày càng phát triển trong lĩnh vực ứng dụng AI hiệu năng cao

📌 Cerebras Systems đã tạo bước đột phá với chip AI tích hợp 4 nghìn tỷ bóng bán dẫn, nhanh gấp 20 lần GPU Nvidia. Công nghệ này đặc biệt phù hợp cho các mô hình AI lớn đòi hỏi xử lý thời gian thực, trong khi Nvidia vẫn duy trì lợi thế về tính đa năng và hệ sinh thái toàn diện.

https://www.barchart.com/story/news/29249699/new-ai-chip-leaves-nvidia-amd-and-intel-in-the-dust-with-20x-faster-speeds-and-over-4-trillion-transistors

Không có file đính kèm.

Nguồn tham khảo

110

Semi-Cloud-DC-Green AI chips-hardware-compute 2024-10-29 06:40:51

Ấn Độ phát triển nền tảng cloud nguồn mở tích hợp AI nhằm cạnh tranh với Amazon, Google và Microsoft

• Sự bùng nổ của AI và số hóa nền kinh tế đang tạo ra nhu cầu chưa từng có về năng lực điện toán

• Amazon, Google và Microsoft hiện chiếm 67% thị phần điện toán đám mây toàn cầu, gây khó khăn cho việc phát triển các ứng dụng AI do chi phí cao

• Tổ chức phi lợi nhuận People+ai phát triển dự án Open Cloud Compute (OCC) nhằm tạo ra thị trường mở cho các nhà cung cấp dịch vụ điện toán đám mây kết hợp AI

• Trong lĩnh vực AI, độ trễ là vấn đề quan trọng với các ứng dụng như phân tích camera an ninh, đòi hỏi nguồn tính toán gần với người dùng

• Một nhóm sinh viên tại hackathon đã phát triển hệ thống AI phân tích sơ đồ kiến trúc hạ tầng đám mây và tự động thiết lập tài nguyên cần thiết

• Chi phí triển khai AI trên nền tảng của nhà cung cấp Ấn Độ rẻ hơn đáng kể: 6 giờ sử dụng Jarvislab chỉ tốn dưới 100 rupee (khoảng 1,19 USD), so với 5 USD cho thiết lập cơ bản trên AWS

• OCC đặc biệt phù hợp với các startup AI, doanh nghiệp nhỏ và sinh viên nghiên cứu AI - những đối tượng có ngân sách hạn chế

• Nền tảng sẽ sử dụng các giao thức và tiêu chuẩn mở để đảm bảo khả năng tương tác giữa các dịch vụ, cho phép người dùng dễ dàng chuyển đổi giữa các nhà cung cấp

• Dự án tích hợp các sáng kiến như Open Application Model và Cloud Native Computing Foundation để hỗ trợ phát triển AI

• Mục tiêu cuối cùng là tạo ra hệ sinh thái mở cho phép các workload AI có thể di chuyển liền mạch giữa các nhà cung cấp

📌 Ấn Độ tiên phong trong việc dân chủ hóa điện toán đám mây và AI với dự án OCC. Nền tảng giúp tiết kiệm tới 76% chi phí triển khai AI, tạo cơ hội cho các nhà cung cấp địa phương cạnh tranh và thúc đẩy sự phát triển của AI tại các nước đang phát triển.

https://spectrum.ieee.org/cloud-computing-in-india

Không có file đính kèm.

Nguồn tham khảo

107

Semi-Cloud-DC-Green AI chips-hardware-compute 2024-10-29 05:57:24

Cách mạng hóa thiết kế trung tâm dữ liệu: Khi AI đòi hỏi tăng hiệu năng gấp 1.000 lần

• AI đang yêu cầu tăng hiệu năng từ 100 đến 1.000 lần giữa các thế hệ, đặc biệt khi chuyển từ AI truyền thống sang AI tạo sinh

• Định luật Moore đang chậm lại, trong khi nhu cầu về hiệu năng phần cứng đang đẩy mức tiêu thụ điện năng và nhiệt lượng lên mức chưa từng có

• Các startup AI đã gặp nhiều thách thức:
- Nhiều công ty phát triển kiến trúc tùy chỉnh chỉ hiệu quả với một số ít mô hình
- Các startup còn sót lại như Cerebras, Groq và SambaNova đã chuyển sang xây dựng trung tâm dữ liệu để cung cấp AI dưới dạng dịch vụ

• Nvidia CEO Jensen Huang đề xuất khái niệm "trung tâm dữ liệu là đơn vị tính toán mới", phân loại thành:
- Trung tâm dữ liệu AI: xử lý đa dạng tác vụ bao gồm AI
- Nhà máy AI: tập trung vào khối lượng công việc AI đòi hỏi cao

• Các thách thức chính trong thiết kế trung tâm dữ liệu AI:
- Nguồn điện: cần đặt gần các trạm phát điện hoặc lắp đặt thiết bị phát điện mới
- Quản lý nhiệt: chuyển từ làm mát bằng không khí sang làm mát bằng chất lỏng có thể tiết kiệm tới 40% điện năng cho máy chủ
- Thiết kế xử lý: cần đưa bộ nhớ, bộ xử lý, bộ tăng tốc và mạng lại gần nhau hơn

• Xu hướng mới trong thiết kế chip:
- Tách biệt xử lý thành các bộ xử lý chuyên biệt
- Sử dụng DPU để giảm tải các tác vụ như lưu trữ, mạng và bảo mật
- Tối ưu hóa thiết kế ngay từ đầu thay vì cải tiến qua các thế hệ

📌 Trung tâm dữ liệu đang trải qua cuộc cách mạng thiết kế toàn diện để đáp ứng nhu cầu tăng hiệu nanwg gấp 1.000 lần của AI. Giải pháp đòi hỏi cách tiếp cận tổng thể từ cơ sở hạ tầng đến chip, với việc tối ưu hóa năng lượng và nhiệt là ưu tiên hàng đầu.

https://www.forbes.com/sites/tiriasresearch/2024/10/28/system-design-for-the-ai-era-data-centers-require-a-holistic-approach/

Không có file đính kèm.

Nguồn tham khảo

129

AI chips-hardware-compute Semi-Cloud-DC-Green 2024-10-29 05:31:43

Khám phá cụm máy tính siêu cấp AI Colossus của Elon Musk với 100.000 GPU

• Siêu máy tính AI Colossus của xAI đã hoàn thành sau 122 ngày lắp đặt và hoạt động được gần 2 tháng

• Cấu trúc phần cứng:
- Mỗi máy chủ GPU sử dụng Nvidia HGX H100 chứa 8 GPU H100
- Mỗi rack chứa 8 máy chủ (64 GPU/rack)
- Tổng cộng hơn 1.500 rack GPU, xấp xỉ 200 dãy rack
- Lắp đặt 100.000 GPU chỉ trong 3 tuần

• Hệ thống làm mát:
- Sử dụng công nghệ làm mát bằng chất lỏng
- Mỗi máy chủ có hệ thống làm mát hot-swappable
- Có manifold 1U giữa các HGX H100
- Mỗi rack có hệ thống bơm dự phòng

• Kết nối mạng:
- Mỗi card đồ họa có NIC riêng 400GbE
- Mỗi máy chủ có thêm NIC 400Gb
- Tổng băng thông mỗi máy chủ HGX H100 đạt 3,6 Terabit/giây
- Sử dụng kết nối Ethernet thay vì InfiniBand

• Nguồn điện:
- Mỗi máy chủ có 4 nguồn điện dự phòng
- Sử dụng pin Tesla Megapack (3,9 MWh/pin) làm bộ đệm năng lượng
- 14 máy phát diesel được lắp đặt vào tháng 7

• Kế hoạch nâng cấp:
- Giai đoạn tiếp theo sẽ thêm 50.000 GPU H100 và 50.000 GPU H200
- Mục tiêu cuối cùng là đạt 300.000 GPU H200

📌 Colossus là siêu máy tính AI lớn nhất thế giới với 100.000 GPU H100, được sử dụng để huấn luyện chatbot Grok 3 và các mô hình AI tương lai. Hệ thống có kiến trúc độc đáo với làm mát bằng chất lỏng và băng thông mạng 3,6 Terabit/giây cho mỗi máy chủ.

https://www.tomshardware.com/desktops/servers/first-in-depth-look-at-elon-musks-100-000-gpu-ai-cluster-xai-colossus-reveals-its-secrets

Không có file đính kèm.

Nguồn tham khảo

129

AI chips-hardware-compute Semi-Cloud-DC-Green 2024-10-27 07:55:16

Bất ngờ với chiến lược AI của gã khổng lồ Amazon: Chậm mà chắc!

• Matt Garman, CEO Amazon Web Services từ tháng 6/2024, đang chịu trách nhiệm định hướng việc ứng dụng AI trong dịch vụ điện toán đám mây

• Amazon không chậm trong việc triển khai AI tạo sinh mà đã có chiến lược riêng:
- Tập trung vào bảo mật và kiểm soát dữ liệu khách hàng
- Phát triển nền tảng cho phép khách hàng xây dựng các ứng dụng AI độc đáo
- Tin rằng sẽ có nhiều mô hình AI khác nhau thay vì chỉ một mô hình duy nhất

• Về vấn đề năng lượng:
- Amazon đã mua lò phản ứng hạt nhân nhỏ, dự kiến hoạt động từ 2030
- Hợp tác với Talend để tái sử dụng gần 1 gigawatt điện hạt nhân tại Pennsylvania
- Đang triển khai nhiều dự án năng lượng tái tạo trong ngắn hạn

• Quan điểm về quy định AI:
- Sẵn sàng tuân thủ các quy định của chính phủ
- Cảnh báo việc đặt ra quy định có thể vô tình tạo lợi thế cho Trung Quốc
- Cho rằng không nên không có quy định nào, nhưng cần thận trọng

• Chính sách làm việc tại văn phòng:
- Yêu cầu nhân viên làm việc 5 ngày/tuần tại văn phòng từ tháng 1/2025
- Lý do: tăng cường sáng tạo và tương tác giữa các nhóm
- Mô hình làm việc 3 ngày/tuần không hiệu quả do nhân viên chọn ngày khác nhau

📌 Amazon theo đuổi chiến lược AI thận trọng, tập trung vào nền tảng để khách hàng tự xây dựng ứng dụng AI. Công ty đầu tư vào năng lượng hạt nhân từ 2030 và yêu cầu nhân viên quay lại văn phòng 100% thời gian từ 2025 để tăng hiệu quả sáng tạo.

https://www.wsj.com/tech/ai/amazon-ai-cloud-matt-garman-4994447a

#WSJ

Không có file đính kèm.

Nguồn tham khảo

139

AI chips-hardware-compute Semi-Cloud-DC-Green 2024-10-26 06:38:10

Quốc vương Đan Mạch ví Jensen Huang như một vị vua mặc áo khoác da khi khánh thành siêu máy tính AI Gefion

• Siêu máy tính AI Gefion được khánh thành tại Copenhagen với sự tham dự của CEO Nvidia Jensen Huang và Quốc vương Frederik X của Đan Mạch

• Gefion được xây dựng trên nền tảng Nvidia DGX SuperPOD, trang bị 1.528 GPU Nvidia H100

• Mục tiêu của siêu máy tính là thúc đẩy nghiên cứu trong các lĩnh vực điện toán lượng tử, y học và năng lượng xanh

• Quốc vương Frederik X hài hước nhận xét về Jensen Huang: "Tôi cảm thấy không chỉ có một vị vua trong căn phòng này - vị vua còn lại đang mặc áo khoác da"

• Trung tâm AI Đan Mạch (DCAI) sở hữu và vận hành Gefion, là sự hợp tác giữa Quỹ Novo Nordisk và Quỹ Đầu tư Xuất khẩu Đan Mạch (EIFO)

• Tổng vốn đầu tư ban đầu cho siêu máy tính:
- Quỹ Novo Nordisk: 600 triệu DKK (khoảng 87 triệu USD)
- EIFO: 100 triệu DKK (khoảng 14,5 triệu USD)

• EIFO nắm giữ 15% cổ phần trong DCAI

• Nvidia hiện đang dẫn đầu trong phát triển phần cứng AI, từng vượt qua Apple, Microsoft và Google để trở thành công ty có giá trị nhất thế giới

📌 Siêu máy tính Gefion với 1.528 GPU Nvidia H100 đánh dấu bước tiến quan trọng của Đan Mạch trong lĩnh vực AI, được đầu tư 101,5 triệu USD từ sự hợp tác công-tư, nhằm thúc đẩy nghiên cứu về điện toán lượng tử, y học và năng lượng xanh.

https://www.tomshardware.com/tech-industry/artificial-intelligence/nvidia-ceo-jensen-huang-and-the-king-of-denmark-plug-in-the-countrys-first-ai-supercomputer-gefion-leverages-1-528-nvidia-h100-ai-gpus

Không có file đính kèm.

Nguồn tham khảo

122

AI chips-hardware-compute Semi-Cloud-DC-Green 2024-10-25 06:56:47

GPU cho trung tâm dữ liệu AI có tuổi thọ chỉ khoảng 3 năm

GPU cho trung tâm dữ liệu AI có tuổi thọ ngắn, chỉ khoảng 3 năm theo thông tin từ một kỹ sư của Google. Điều này đặt ra vấn đề lớn cho các công ty công nghệ khi họ đang đầu tư hàng tỷ USD vào phần cứng AI.
Nguồn thông tin này đến từ tài khoản TechFund, dẫn lời một kiến trúc sư AI của Alphabet. Theo đó, các trung tâm dữ liệu có mức sử dụng cao, như Lambda Labs và CoreWeave với mức sử dụng từ 60-70%, dễ gặp tình trạng hỏng hóc phần cứng trong thời gian ngắn hơn.
Lượng điện năng tiêu thụ lớn của GPU AI là nguyên nhân chính làm giảm tuổi thọ. Các GPU như dòng Hopper tiêu thụ tới 700W, trong khi dòng Blackwell thế hệ mới có thể lên đến 1.000W. Điều này gây ra áp lực nhiệt lớn lên các vi mạch silicon, tương tự như các GPU từng được dùng trong khai thác tiền điện tử, thường bị lỗi sau vài năm.
Chi phí khổng lồ cho phần cứng AI đang là gánh nặng cho các công ty lớn. OpenAI dự kiến lỗ 5 tỷ USD trong năm 2024, mặc dù chi phí phần cứng được Microsoft hỗ trợ đáng kể. Google đã chi 13,2 tỷ USD chỉ trong quý II năm 2024 và sẽ tiếp tục tăng chi tiêu. Nếu các GPU chỉ kéo dài ba năm, việc đầu tư vào AI sẽ trở thành gánh nặng chi phí liên tục thay vì khoản đầu tư dài hạn.
Các nhà đầu tư đang đặt câu hỏi về khả năng sinh lời của AI. Dù nhiều công ty cam kết phát triển các mô hình lớn hơn, việc đào tạo và vận hành chúng sẽ tiêu tốn hàng tỷ USD. Hơn nữa, với tuổi thọ ngắn của GPU, việc thay thế phần cứng sẽ trở thành nhu cầu liên tục.
Nvidia đang hưởng lợi lớn từ tình thế này. Giá trị của Nvidia đã vượt 3 nghìn tỷ USD vào tháng 6/2024, và nếu các công ty AI phải liên tục mua GPU mới, lợi nhuận của Nvidia sẽ tiếp tục tăng nhanh hơn.

📌

Tuổi thọ ngắn của GPU trong các trung tâm dữ liệu AI là vấn đề lớn cho ngành công nghệ, khiến chi phí phần cứng trở thành gánh nặng liên tục. Trong khi các công ty phải đối mặt với thách thức tài chính, Nvidia hưởng lợi từ nhu cầu thay thế liên tục. Điều này có thể định hình tương lai của thị trường AI, nơi đầu tư vào phần cứng trở thành cuộc đua không ngừng nghỉ.

https://www.extremetech.com/computing/data-center-ai-gpus-may-have-extremely-short-lifespans

Không có file đính kèm.

Nguồn tham khảo

129

AI chips-hardware-compute 2024-10-25 06:52:18

Vì sao Intel bị bỏ lại phía sau trong cuộc đua chip AI?

Intel đã bỏ lỡ cơ hội lịch sử khi từ chối mua Nvidia vào năm 2005 với giá 20 tỷ USD. Lúc đó, Nvidia được coi là công ty chuyên về đồ họa, nhưng công nghệ chip của họ đã chứng minh tiềm năng lớn cho AI sau này.
Intel gặp nhiều thất bại chiến lược khi cố gắng phát triển chip đồ họa nội bộ thông qua dự án Larrabee. Dự án này tiêu tốn hàng trăm triệu USD nhưng bị hủy bỏ vào năm 2009 do không đáp ứng được kỳ vọng về hiệu năng.
Pat Gelsinger, CEO hiện tại của Intel, tin rằng Larrabee có thể đã thành công nếu được kiên nhẫn đầu tư. Tuy nhiên, sau khi rời Intel vào năm 2009, ông trở lại vào năm 2021 với nhiệm vụ phục hồi công ty, đối mặt với những thách thức lớn trong thời kỳ AI bùng nổ.
Intel đầu tư vào các công ty khởi nghiệp AI như Nervana Systems và Habana Labs, nhưng chiến lược thiếu nhất quán đã gây lãng phí thời gian và nguồn lực. Quyết định mua Habana Labs với giá 2 tỷ USD khiến Intel mất hai năm phát triển sản phẩm AI.
Nvidia đã vượt xa Intel nhờ đầu tư vào cả phần cứng lẫn phần mềm, hỗ trợ lập trình viên phát triển ứng dụng AI trên nền tảng của mình. Ngược lại, Intel chật vật trong việc tạo ra các sản phẩm AI cạnh tranh, dẫn đến việc thị phần của họ bị thu hẹp.
Mặc dù Intel nhận được hỗ trợ từ chính phủ Mỹ thông qua Đạo luật CHIPS, công ty vẫn gặp khó khăn trong việc bắt kịp các đối thủ châu Á về công nghệ sản xuất chip. Nhiều chip mới của Intel được sản xuất bởi TSMC, giảm lợi nhuận của công ty.
Cơ hội mới của Intel nằm trong việc phát triển các ứng dụng AI cho doanh nghiệp và trung tâm dữ liệu. Tuy nhiên, Nvidia đã xây dựng vị thế vững chắc trong thị trường AI, khiến Intel khó có thể bắt kịp trong thời gian ngắn.

📌

Intel đã bỏ lỡ cơ hội dẫn đầu trong thị trường AI do các quyết định chiến lược sai lầm và thiếu kiên nhẫn đầu tư. Mặc dù công ty đang cố gắng phục hồi dưới sự lãnh đạo của Pat Gelsinger, Nvidia đã vượt xa trong cuộc đua AI. Với sự hỗ trợ của chính phủ và các chip mới như Gaudi 3, Intel hy vọng tìm thấy cơ hội trong ứng dụng AI cho doanh nghiệp, nhưng con đường phía trước vẫn rất gian nan.

https://www.nytimes.com/2024/10/24/technology/intel-ai-chips-mistakes.html

Không có file đính kèm.

Nguồn tham khảo

117

AI chips-hardware-compute 2024-10-24 05:31:08

Nvidia thừa nhận lỗi thiết kế trong nền tảng AI Blackwell đã khiến sản xuất bị đình trệ

- Nvidia thừa nhận lỗi thiết kế trong nền tảng AI Blackwell đã khiến sản xuất bị đình trệ, gây ảnh hưởng đến khách hàng lớn như Google và Microsoft.
- Jensen Huang, CEO Nvidia, cho biết sự phức tạp trong dự án với 7 thiết kế chip mới đã góp phần vào lỗi này, khẳng định “đây là lỗi 100% do Nvidia.”
- Vấn đề bắt đầu xuất hiện từ tháng 8/2024, khiến cổ phiếu Nvidia giảm 8% khi có thông tin chậm giao hàng ba tháng. Nvidia đã hợp tác với TSMC để cải thiện tỷ lệ sản xuất.
- Công ty đã thay đổi thiết kế mặt nạ GPU nhưng không cần thay đổi chức năng. Nvidia dự kiến sẽ tạo ra doanh thu hàng tỷ USD từ nền tảng Blackwell trong quý IV.
- Jensen Huang khẳng định quá trình phục hồi đã thành công và sản xuất hiện đang ở "tốc độ đáng kinh ngạc" với nhu cầu vượt xa dự kiến.
- Trong lần xuất hiện tại Đan Mạch để giới thiệu siêu máy tính Gefion, Huang nhấn mạnh: “Ai cũng muốn sở hữu nhiều nhất và sớm nhất.”
- Cổ phiếu Nvidia giảm 3,3% vào giữa ngày thứ Tư nhưng vẫn tăng 189% từ đầu năm, với kỳ vọng cao trước báo cáo tài chính của các công ty công nghệ lớn.
- Mặc dù có khủng hoảng ban đầu, Nvidia đã nhanh chóng phục hồi, đáp ứng nhu cầu thị trường ngày càng tăng đối với chip AI tiên tiến.

📌 Nvidia gặp khó khăn với lỗi thiết kế chip AI Blackwell, làm gián đoạn sản xuất, nhưng đã khắc phục thành công nhờ hợp tác với TSMC. Dù cổ phiếu có biến động, nhu cầu đối với Blackwell vẫn bùng nổ, củng cố vị thế của Nvidia trong lĩnh vực AI.

https://qz.com/nvidia-jensen-huang-design-flaw-blackwell-fault-ai-chip-1851679078

Không có file đính kèm.

Nguồn tham khảo

112

AI chips-hardware-compute 2024-10-17 00:50:09

Saudi Arabia chọn chip AI Mỹ, từ chối hợp tác với Trung Quốc

• Giáo sư Edward Byrne, tân hiệu trưởng Đại học Khoa học và Công nghệ Vua Abdullah (Kaust) của Saudi Arabia, cam kết ngừng mọi hợp tác AI với Trung Quốc có thể ảnh hưởng đến việc tiếp cận chip do Mỹ sản xuất.

• Byrne nhấn mạnh sẽ ưu tiên quan hệ với Anh, châu Âu và Mỹ, đồng thời đảm bảo các nhà nghiên cứu tại Kaust có quyền truy cập công nghệ AI cần thiết.

• Ông cam kết tuân thủ nghiêm ngặt các quy định thương mại của Mỹ để duy trì hợp tác, nhưng vẫn thấy cơ hội hợp tác với Trung Quốc trong nhiều lĩnh vực không nhạy cảm.

• Mỹ đã thắt chặt kiểm soát giấy phép xuất khẩu chip AI tiên tiến nhằm ngăn chặn công nghệ rò rỉ sang Trung Quốc, gây lo ngại cho khu vực Trung Đông.

• Microsoft, đã đầu tư 1,5 tỷ USD vào G42 - công ty AI lớn nhất ở UAE, yêu cầu làm rõ về việc vận chuyển chip AI đến khu vực.

• Người tiền nhiệm của Byrne, Tony Chan, đã mở rộng hợp tác với Trung Quốc, đặc biệt là dự án AI chung để xây dựng mô hình ngôn ngữ lớn tập trung vào tiếng Ả Rập có tên AceGPT.

• Kaust được thành lập năm 2009 với quỹ tài trợ 10 tỷ USD từ cố vương Abdullah, là trường đại học nghiên cứu sau đại học đầu tiên của Saudi Arabia.

• Saudi Arabia và UAE đang chạy đua phát triển AI và xây dựng quan hệ thương mại với cả Mỹ và Trung Quốc mà không làm mất lòng Washington - đối tác an ninh chính.

• Một quỹ Saudi trở thành nhà đầu tư nước ngoài duy nhất vào startup AI tạo sinh nổi bật nhất của Trung Quốc vào tháng 5/2023.

• Các quan chức cấp cao Saudi đang tích cực làm việc để đảm bảo tiếp cận chip AI tiên tiến do Mỹ sản xuất, đặc biệt là từ Nvidia.

• Saudi Arabia tổ chức hội nghị AI lớn ở Riyadh vào tháng trước, nơi Cơ quan Dữ liệu và Trí tuệ nhân tạo Saudi (SDAIA) trưng bày mô hình ngôn ngữ lớn tiếng Ả Rập và công bố thỏa thuận với Nvidia về 5.000 GPU.

• Một quan chức cho biết SDAIA đã có quyền truy cập 1.000 GPU từ Nvidia và lạc quan về việc tiếp cận thêm trong tương lai gần.

📌 Saudi Arabia đang cân bằng giữa hợp tác AI với Mỹ và Trung Quốc. Kaust cam kết tuân thủ quy định Mỹ để tiếp cận chip AI tiên tiến. Saudi đã đạt thỏa thuận 5.000 GPU với Nvidia và đang tích cực phát triển mô hình ngôn ngữ lớn tiếng Ả Rập, thể hiện tham vọng AI của quốc gia này.

https://www.ft.com/content/1652e551-dac7-40a5-9621-7453d13af613

#FT

Không có file đính kèm.

Nguồn tham khảo

125

AI market AI chips-hardware-compute 2024-10-12 09:22:27

Cuộc chiến chống độc quyền AI: Châu Á quyết tâm ngăn chặn sự thống trị của các bigtech!

• Các cơ quan quản lý cạnh tranh tại Nhật Bản và Hàn Quốc đã bắt đầu điều tra về tác động cạnh tranh của thị trường AI tạo sinh đang phát triển nhanh chóng.

• Ủy ban Thương mại Công bằng Nhật Bản (JFTC) bắt đầu nghiên cứu thị trường AI tạo sinh vào tháng 10/2024 để xem xét cạnh tranh ở các cấp độ cơ sở hạ tầng, mô hình và ứng dụng.

• JFTC dự báo ngành AI tạo sinh tại Nhật sẽ tăng trưởng trung bình 47,2% mỗi năm từ 2023 đến 2030.

• Tại cấp độ cơ sở hạ tầng, JFTC quan tâm đến vị thế thống trị của NVIDIA trong lĩnh vực GPU, sự khác biệt về dữ liệu huấn luyện giữa các mô hình quốc tế và Nhật Bản, cũng như khó khăn của các công ty Nhật trong việc giữ chân nhân tài AI.

• Ở cấp độ mô hình, JFTC nhận thấy các mô hình ngôn ngữ lớn quốc tế dẫn đầu về suy luận và đa ngôn ngữ, trong khi các công ty nội địa tập trung vào hiệu suất tiếng Nhật hoặc tạo ra các mô hình chuyên biệt.

• Tại cấp độ ứng dụng, JFTC muốn xác định các rào cản đối với doanh nghiệp và thách thức trong việc duy trì cạnh tranh công bằng.

• JFTC cũng lo ngại về việc hạn chế tiếp cận GPU, ưu tiên dịch vụ của công ty, ràng buộc dịch vụ với việc sử dụng mô hình, hành vi song song sử dụng AI và độc quyền nhân tài thông qua hợp tác.

• Ủy ban Thương mại Công bằng Hàn Quốc (KFTC) đã khởi động nghiên cứu thị trường AI vào tháng 8/2024, tập trung vào 50 công ty trong và ngoài nước.

• KFTC sẽ phân tích mối quan hệ kinh doanh, xu hướng cạnh tranh và xác định các vấn đề có thể làm suy yếu cạnh tranh.

• Ủy ban Cạnh tranh và Người tiêu dùng Úc (ACCC) cũng đang theo dõi chặt chẽ sự phát triển của thị trường AI và sẽ xem xét các vấn đề cạnh tranh liên quan đến AI tạo sinh trong báo cáo vào tháng 3/2025.

• ACCC quan tâm đến rào cản gia nhập thị trường cao và khả năng các nền tảng kỹ thuật số lớn mở rộng quyền lực thị trường thông qua tích hợp các mô hình ngôn ngữ lớn.

📌 Các cơ quan quản lý cạnh tranh tại Nhật Bản, Hàn Quốc và Úc đang tích cực điều tra và giám sát thị trường AI tạo sinh đang phát triển nhanh chóng. Mục tiêu là ngăn chặn sự độc quyền, thúc đẩy cạnh tranh công bằng và đảm bảo lợi ích người tiêu dùng trong lĩnh vực công nghệ mới nổi này.

https://www.techrepublic.com/article/apac-concerns-foreign-ai-monopoly-competition/

Không có file đính kèm.

Nguồn tham khảo

102

AI chips-hardware-compute 2024-10-11 08:13:55

AMD tung "vũ khí" mới trong cuộc đua AI: GPU Instinct MI325x có thể đánh bại Nvidia?

• AMD vừa công bố dòng GPU Instinct MI325x mới tại hội nghị Advancing AI ở San Francisco, nhắm đến việc tăng cường hiệu suất và hiệu quả cho các tác vụ AI phức tạp.

• Instinct MI325x được thiết kế đặc biệt để tăng tốc quá trình đào tạo mô hình nền tảng, tinh chỉnh và suy luận.

• GPU mới có bộ nhớ HBM3E 256GB với băng thông 6TB/s, cao hơn 1,8 lần về dung lượng và 1,3 lần về băng thông so với dòng H200 của Nvidia.

• Về khả năng suy luận LLM, MI325x có thể mang lại hiệu suất cao hơn 1,3 lần trên mô hình Mistral 7B và 1,2 lần trên Llama 3.1 70B.

• Dự kiến MI325x sẽ bắt đầu sản xuất vào Q4/2024 và có sẵn rộng rãi từ các nhà cung cấp nền tảng như Dell, HPE, Lenovo, Supermicro vào Q1/2025.

• AMD cũng hé lộ kế hoạch cho dòng Instinct MI350 thế hệ tiếp theo, dự kiến ra mắt vào nửa cuối năm 2025.

• MI350 sẽ dựa trên kiến trúc CDNA 4, hứa hẹn cải thiện hiệu suất suy luận gấp 35 lần so với các bộ tăng tốc dựa trên CDNA 3.

• Bộ nhớ của MI350 sẽ đạt 288GB HBM3E trên mỗi bộ tăng tốc.

• Động thái này của AMD thể hiện nỗ lực cạnh tranh mạnh mẽ với Nvidia trong lĩnh vực AI, đặc biệt là về hiệu suất và khả năng xử lý các mô hình ngôn ngữ lớn.

• Việc ra mắt liên tiếp các dòng GPU mới cho thấy AMD đang đẩy nhanh lộ trình phát triển của mình trong lĩnh vực AI.

📌 AMD tung ra GPU Instinct MI325x với bộ nhớ HBM3E 256GB, băng thông 6TB/s, vượt trội so với Nvidia H200. Dự kiến ra mắt Q4/2024, tiếp theo là MI350 vào 2025 với hiệu suất suy luận tăng 35 lần, thể hiện tham vọng dẫn đầu của AMD trong cuộc đua AI.

https://www.itpro.com/hardware/amds-new-instinct-gpus-might-just-blow-nvidia-out-of-the-water

Không có file đính kèm.

Nguồn tham khảo

145

AI chips-hardware-compute 2024-10-07 14:14:55

Baidu ra mắt Baige 4.0, nâng cao hiệu suất cụm GPU với 99.5% hiệu quả đào tạo cho LLM

- Baige 4.0 của Baidu đạt hiệu suất đào tạo 99.5% cho LLMs trên hàng chục ngàn GPU.
- Nền tảng mới tập trung vào việc cải thiện độ ổn định và hiệu quả của cụm GPU.
- Tính năng nổi bật bao gồm giám sát cụm GPU, tự động phát hiện sự cố và di chuyển khối lượng công việc để ngăn chặn gián đoạn.
- Hệ thống cải thiện khả năng phát hiện và định vị lỗi, giảm thiểu thời gian chết tốn kém.
- Baige 4.0 có khả năng xử lý các cụm lên tới 100.000 GPU, mở rộng hạ tầng đào tạo AI.
- Hiệu suất suy diễn mô hình đã tăng gấp đôi trong suy diễn văn bản dài nhờ kỹ thuật phân tách kiến trúc và phân phối tải.
- Ngân hàng Tiết kiệm Bưu điện Trung Quốc sử dụng Baige để rút ngắn thời gian lặp mô hình từ 1,5 tháng xuống còn nửa ngày.
- Changan Automobile áp dụng Baige cho đào tạo mô hình lái xe tự động, nâng cao hiệu quả sử dụng sức mạnh tính toán.
- Các công ty khởi nghiệp như Shengshu Tech phát triển công cụ tạo video Vidu dựa trên Baige như một lựa chọn địa phương cho các mô hình quốc tế nổi tiếng.
- Qianfan 3.0 được nâng cấp với khả năng truy cập gần một trăm mô hình lớn như ERNIE, giảm chi phí gọi mô hình hơn 90%.
- Qianfan 3.0 hỗ trợ phát triển cả mô hình lớn và nhỏ trong các lĩnh vực như thị giác máy tính và xử lý ngôn ngữ tự nhiên.
- Nền tảng “AI Suda” cho phép doanh nghiệp xây dựng ứng dụng qua đối thoại ngôn ngữ tự nhiên, dễ dàng tiếp cận cho người không chuyên.
- Robin Li, CEO của Baidu, cho biết khoảng 18% kết quả tìm kiếm trực tuyến hiện tại được hỗ trợ bởi AI.
- Những cải tiến của Baidu trong Baige 4.0 và Qianfan 3.0 thể hiện sự ảnh hưởng ngày càng tăng của Trung Quốc trong cuộc đua AI toàn cầu.

📌 Baidu đã ra mắt Baige 4.0 với hiệu suất đào tạo LLMs đạt 99.5% trên hàng chục ngàn GPU và nâng cấp Qianfan 3.0 giúp giảm chi phí gọi mô hình hơn 90%. Những đổi mới này khẳng định vị thế cạnh tranh của Baidu trong lĩnh vực AI toàn cầu.

https://analyticsindiamag.com/ai-news-updates/baidu-launches-baige-4-0-for-boosting-gpu-cluster-efficiency-and-ai-platform-qianfan-3-0/

Không có file đính kèm.

Nguồn tham khảo

151

Semi-Cloud-DC-Green AI chips-hardware-compute 2024-10-07 07:52:18

Eric Schmidt, cựu CEO Google, kêu gọi đầu tư mạnh vào cơ sở hạ tầng AI bất chấp tác động môi trường

• Eric Schmidt, cựu CEO Google, kêu gọi đầu tư toàn diện vào cơ sở hạ tầng AI, bất chấp mục tiêu khí hậu khó đạt được.

• Sự bùng nổ AI đã thúc đẩy chi tiêu cho các trung tâm dữ liệu, cung cấp sức mạnh tính toán cho các mô hình AI.

• Theo McKinsey, các trung tâm dữ liệu dự kiến sẽ tiêu thụ 35 gigawatt điện hàng năm vào năm 2030, tăng từ 17 gigawatt năm ngoái.

• Chính quyền Biden đặt mục tiêu ngành điện trung hòa carbon vào năm 2035 và nền kinh tế Mỹ đạt mức phát thải ròng bằng 0 vào năm 2050.

• Nhu cầu năng lượng lớn của AI đã khiến một số lãnh đạo AI chuyển sang nhiên liệu hóa thạch, đe dọa các mục tiêu phát thải ròng bằng 0.

• Schmidt cho rằng có cách giảm thiểu tác động tiêu cực của AI đến môi trường, như sử dụng pin và đường dây điện tốt hơn để xây dựng trung tâm dữ liệu.

• Tuy nhiên, ông tin rằng sự phát triển của AI cuối cùng sẽ vượt qua các biện pháp phòng ngừa này.

• Schmidt nói: "Tất cả sẽ bị lấn át bởi nhu cầu to lớn của công nghệ mới này".

• Ông cho rằng chúng ta sẽ không đạt được các mục tiêu khí hậu vì "chúng ta không được tổ chức để làm điều đó".

• Schmidt tuyên bố: "Tôi thà đặt cược vào AI giải quyết vấn đề còn hơn là hạn chế nó và gặp phải vấn đề".

• Năm 2022, Schmidt thành lập White Stork, một công ty quốc phòng phát triển máy bay không người lái được hỗ trợ bởi AI.

• Tại một bài giảng ở Đại học Stanford vào tháng 4, Schmidt nói rằng cuộc chiến ở Ukraine đã biến ông thành một "thương nhân vũ khí".

• Ông cũng cho biết White Stork sẽ "sử dụng AI theo những cách phức tạp, mạnh mẽ cho những cuộc chiến về cơ bản là robot này".

📌 Eric Schmidt, cựu CEO Google, ủng hộ phát triển AI toàn diện bất chấp tác động môi trường. Ông dự đoán trung tâm dữ liệu sẽ tiêu thụ 35 gigawatt điện năm 2030, gấp đôi hiện tại. Schmidt tin AI sẽ giải quyết vấn đề khí hậu, thay vì hạn chế phát triển nó.

https://www.businessinsider.com/eric-schmidt-google-ai-data-centers-energy-climate-goals-2024-10

Không có file đính kèm.

Nguồn tham khảo

105

AI chips-hardware-compute AI kiến thức-khóa học 2024-10-06 16:15:15

NPU - "Bộ não AI" đang âm thầm xuất hiện trong mọi thiết bị điện tử của bạn

• NPU (Neural Processing Unit) là đơn vị xử lý thần kinh, một loại bộ xử lý chuyên dụng để tăng tốc các tác vụ AI.

• NPU đã xuất hiện trên smartphone từ vài năm trước, gần đây bắt đầu phổ biến trên laptop và PC tiêu dùng.

• Các hãng lớn như Intel, AMD, Apple, Qualcomm đều đang tích hợp NPU vào chip của mình.

• NPU đóng vai trò là bộ tăng tốc phần cứng cho AI, bổ sung cho CPU và GPU chứ không thay thế chúng.

• NPU phù hợp với các tác vụ lặp đi lặp lại, ít rẽ nhánh có điều kiện và xử lý lượng lớn dữ liệu.

• Kiến trúc NPU gồm nhiều đơn vị con song song, mỗi đơn vị có bộ nhớ cache riêng nhỏ.

• NPU được thiết kế để mô phỏng cách xử lý thông tin của não bộ.

• Các hãng đều phát triển công cụ phần mềm riêng cho NPU của mình như AMD Ryzen AI, Intel OpenVINO.

• NPU đóng vai trò quan trọng trong xu hướng AI biên (edge AI), xử lý dữ liệu cục bộ nhanh hơn và bảo mật hơn.

• NPU hiện có mặt trong nhiều thiết bị tiêu dùng như smartphone, tablet, laptop, PC và cả trong trung tâm dữ liệu.

• Dự kiến đến cuối năm 2026, 100% PC doanh nghiệp tại Mỹ sẽ có NPU tích hợp sẵn.

• Microsoft đã ra mắt dòng sản phẩm Copilot+ AI PC có tích hợp NPU để chạy trợ lý AI Copilot.

• NPU xử lý các tác vụ AI suy luận (inference) ở quy mô nhỏ, khác với GPU xử lý huấn luyện AI quy mô lớn.

• Qualcomm tích hợp NPU vào chip Snapdragon dưới dạng DSP Hexagon.

• Apple gọi NPU trong chip A-series và M-series là Neural Engine.

• Google phát triển TPU (Tensor Processing Unit) - một dạng NPU cho trung tâm dữ liệu.

📌 NPU đang trở thành công nghệ phổ biến trong các thiết bị điện tử, với 100% PC doanh nghiệp Mỹ dự kiến tích hợp NPU vào năm 2026. NPU mang lại khả năng xử lý AI cục bộ nhanh và bảo mật hơn, mở ra tiềm năng ứng dụng AI rộng rãi trên các thiết bị cá nhân.

https://www.extremetech.com/computing/what-is-an-npu

Không có file đính kèm.

Nguồn tham khảo

160

AI chips-hardware-compute AI viễn thông AI pháp lý-quản trị-chủ quyền 2024-10-06 08:42:31

Đột phá: China Telecom huấn luyện LLM nghìn tỷ tham số trên chip Trung Quốc, thách thức lệnh cấm của Mỹ

• China Telecom, nhà mạng nhà nước Trung Quốc, đã công bố việc phát triển 2 mô hình ngôn ngữ lớn (LLM) được huấn luyện hoàn toàn trên chip sản xuất trong nước.

• Mô hình đầu tiên là TeleChat2-115B, mô hình nguồn mở với hơn 100 tỷ tham số.

• Mô hình thứ hai chưa được đặt tên, được cho là có 1 nghìn tỷ tham số.

• Cả hai mô hình được huấn luyện bằng hàng chục nghìn chip sản xuất tại Trung Quốc.

• China Telecom tuyên bố rằng điều này "cho thấy Trung Quốc đã thực sự đạt được sự tự chủ hoàn toàn trong việc huấn luyện LLM trong nước".

• Động thái này là một thách thức đối với các quy định hạn chế xuất khẩu nghiêm ngặt của Mỹ, ngăn chặn việc tiếp cận các GPU cao cấp như Nvidia H100 và A100.

• Mặc dù China Telecom không chỉ rõ nhà cung cấp chip, nhưng có khả năng Huawei đã cung cấp phần lớn, nếu không muốn nói là tất cả.

• Huawei đang định vị mình như một giải pháp thay thế trong nước cho Nvidia.

• China Telecom trước đây đã tiết lộ rằng họ đang phát triển công nghệ LLM sử dụng chip Ascend do Huawei phát triển.

• Huawei gần đây đã bắt đầu gửi mẫu bộ xử lý Ascend 910C mới cho các công ty máy chủ và viễn thông Trung Quốc để thử nghiệm.

• Nhiều công ty Trung Quốc, bao gồm ByteDance và Alibaba, đang chuyển sang sử dụng chip của Huawei để đáp ứng nhu cầu AI.

• ByteDance, chủ sở hữu của TikTok, được cho là đã đặt hàng 100.000 bộ xử lý Ascend.

• China Telecom cũng đang khám phá phần cứng từ Cambricon, một startup chip AI địa phương, để đa dạng hóa nguồn cung chip.

• Mặc dù có thị trường chợ đen sôi động cho GPU cao cấp của Nvidia tại Trung Quốc, nhiều công ty vẫn tuân thủ quy định và sử dụng GPU được phép có thông số kỹ thuật thấp hơn như Nvidia H20.

• Các công ty này muốn tránh rủi ro pháp lý và danh tiếng, đồng thời duy trì quyền truy cập vào hỗ trợ của Nvidia.

📌 China Telecom đã đạt được bước tiến quan trọng trong việc phát triển LLM tự chủ, với hai mô hình có 100 tỷ và 1 nghìn tỷ tham số được huấn luyện trên chip nội địa. Điều này thể hiện sự thách thức của Trung Quốc đối với lệnh cấm của Mỹ và sự trỗi dậy của Huawei như một đối thủ cạnh tranh tiềm năng của Nvidia trong lĩnh vực AI.

https://www.techradar.com/pro/one-of-the-worlds-largest-mobile-networks-will-train-its-trillion-parameter-strong-llm-on-huaweis-ai-chips-as-nvidia-amd-are-sidelined

Không có file đính kèm.

Nguồn tham khảo

174

AI chips-hardware-compute 2024-10-01 08:00:11

ByteDance đang chuyển hướng sang sử dụng chip Huawei để huấn luyện mô hình AI

• ByteDance, công ty mẹ của TikTok, đang lên kế hoạch phát triển một mô hình AI được huấn luyện chủ yếu bằng chip Ascend 910B của Huawei.

• Động thái này diễn ra trong bối cảnh Mỹ hạn chế xuất khẩu chip AI tiên tiến như của Nvidia từ năm 2022, buộc ByteDance phải tìm kiếm nguồn cung trong nước.

• ByteDance đã đa dạng hóa nguồn cung cấp chip AI trong nước và đẩy nhanh việc phát triển chip riêng kể từ khi có lệnh cấm của Mỹ.

• Công ty đã đặt hàng hơn 100.000 chip Ascend 910B trong năm nay nhưng đến tháng 7 mới nhận được dưới 30.000 chip, không đủ đáp ứng nhu cầu.

• Nguồn cung hạn chế và sức mạnh tính toán thấp hơn so với chip Nvidia đã khiến ByteDance chưa thể đặt ra thời hạn cho mô hình mới.

• Mô hình AI mới dự kiến sẽ có khả năng và độ phức tạp thấp hơn so với mô hình Doubao hiện tại của ByteDance.

• ByteDance hiện đang sử dụng chip Ascend 910B chủ yếu cho các tác vụ suy luận ít đòi hỏi tính toán hơn.

• Công ty cũng là khách hàng lớn nhất mua chip H20 AI của Nvidia được thiết kế riêng cho thị trường Trung Quốc.

• ByteDance còn là khách hàng lớn nhất của Microsoft tại châu Á về việc sử dụng chip Nvidia thông qua điện toán đám mây.

• Trước đó, ByteDance đã phân bổ 2 tỷ USD để mua chip Nvidia vào năm ngoái.

• Công nghệ AI hiện tại của ByteDance được sử dụng trong mô hình ngôn ngữ lớn Doubao và nhiều ứng dụng khác như công cụ tạo video từ văn bản Jimeng.

• Chatbot Doubao của ByteDance đã trở thành một trong những ứng dụng phổ biến nhất tại Trung Quốc với hơn 10 triệu người dùng hoạt động hàng tháng.

📌 ByteDance đang chuyển hướng sang sử dụng chip Huawei để phát triển mô hình AI mới do lệnh cấm của Mỹ. Công ty đã đặt hàng hơn 100.000 chip Ascend 910B nhưng gặp khó khăn về nguồn cung. Mô hình mới dự kiến có quy mô nhỏ hơn Doubao hiện tại với hơn 10 triệu người dùng hàng tháng.

https://www.scmp.com/tech/big-tech/article/3280545/bytedance-said-be-turning-huawei-chips-train-ai-model-amid-us-curbs-sources-say

Không có file đính kèm.

Nguồn tham khảo

153

AI chips-hardware-compute 2024-10-01 00:03:54

ByteDance hợp tác với Broadcom phát triển GPU AI riêng

• ByteDance, công ty mẹ của TikTok, đang tìm cách phát triển GPU AI riêng để giảm phụ thuộc vào Nvidia. Công ty này đã chi hơn 2 tỷ USD mua GPU H20 của Nvidia trong năm 2024.

• Hạn chế thương mại của Mỹ gây khó khăn cho các công ty Trung Quốc trong việc tiếp cận phần cứng AI tiên tiến. GPU H20 của Nvidia, phiên bản thu nhỏ của H100, có giá khoảng 10.000 USD/chiếc nhưng vẫn khan hiếm.

• Tình trạng thiếu hụt GPU đã thúc đẩy thị trường đen cho chip cao cấp của Nvidia như H100 và A100, với giá ngày càng tăng do nhu cầu lớn.

• ByteDance dự kiến phát triển 2 loại chip AI: một cho đào tạo AI và một cho suy luận AI. Cả hai sẽ được sản xuất bằng quy trình N4/N5 tiên tiến của TSMC, công nghệ tương tự như GPU Blackwell của Nvidia.

• Broadcom, công ty nổi tiếng với thiết kế chip AI cho Google, sẽ dẫn đầu việc phát triển các GPU này. Dự kiến sản xuất hàng loạt vào năm 2026.

• Nhiều công ty Trung Quốc đã phát triển GPU AI riêng để giảm phụ thuộc vào Nvidia, nhưng hầu hết vẫn dựa vào phần cứng Nvidia cho các tác vụ đòi hỏi cao.

• ByteDance sẽ phải đối mặt với thách thức trong việc phát triển nền tảng phần mềm riêng và đảm bảo tương thích với phần cứng mới, thay vì dựa vào CUDA và hệ thống phần mềm hỗ trợ của Nvidia.

• Việc chuyển đổi hoàn toàn sang phần cứng riêng của ByteDance vẫn còn nhiều điều không chắc chắn.

• Động thái này của ByteDance nhằm đối phó với tình trạng khan hiếm GPU và hạn chế thương mại của Mỹ, đồng thời giảm rủi ro pháp lý và danh tiếng liên quan đến thị trường đen GPU.

📌 ByteDance hợp tác Broadcom phát triển GPU AI riêng, dự kiến sản xuất hàng loạt năm 2026 với công nghệ TSMC. Động thái nhằm giảm phụ thuộc vào Nvidia, đối phó hạn chế thương mại Mỹ. Thách thức lớn là phát triển nền tảng phần mềm tương thích.

https://www.techradar.com/pro/wait-now-broadcom-makes-gpus-nvidia-could-face-unexpected-foe-in-china-as-bytedance-could-use-rival-bigger-than-intel-amd-arm-and-qualcomm-to-design-its-ai-chip

Không có file đính kèm.

Nguồn tham khảo

136

AI chips-hardware-compute 2024-10-01 00:00:31

Trung Quốc đạt bước đột phá trong AI, huấn luyện AI tạo sinh trên nhiều DC và kiến trúc GPU khác nhau

• Theo tiết lộ của Patrick Moorhead, Chuyên gia phân tích trưởng tại Moor Insights & Strategy, Trung Quốc đã phát triển thành công một mô hình AI tạo sinh (GAI) duy nhất trên nhiều trung tâm dữ liệu khác nhau.

• Đây là một thành tựu đáng kinh ngạc, xét đến độ phức tạp của việc sử dụng các GPU khác nhau trong một trung tâm dữ liệu, chứ chưa nói đến việc sử dụng máy chủ ở nhiều vị trí địa lý khác nhau.

• Kỹ thuật huấn luyện GAI trên các địa điểm/kiến trúc khác nhau là rất quan trọng đối với Trung Quốc để duy trì tham vọng AI của họ, đặc biệt khi các lệnh trừng phạt của Mỹ đã ngăn cản nước này tiếp cận các chip mạnh mẽ và tiên tiến nhất.

• Nvidia đã tạo ra chip AI H20 ít mạnh hơn để phù hợp với các thông số hiệu suất hạn chế của Washington, nhằm không mất thị trường Trung Quốc. Tuy nhiên, có tin đồn rằng ngay cả những chip đã bị hạ cấp này cũng có thể sớm bị cấm.

• Để đối phó với tình trạng thiếu hụt GPU hiệu năng cao, các nhà nghiên cứu Trung Quốc đã nỗ lực kết hợp GPU từ các thương hiệu khác nhau thành một cụm huấn luyện duy nhất.

• Kỹ thuật này cho phép các tổ chức kết hợp số lượng hạn chế các chip hiệu năng cao bị trừng phạt như Nvidia A100 với các GPU ít mạnh hơn nhưng dễ tiếp cận như Huawei Ascend 910B hoặc Nvidia H20.

• Mặc dù trước đây việc này thường đi kèm với sự sụt giảm lớn về hiệu quả, nhưng có vẻ như Trung Quốc đã tìm ra cách giải quyết vấn đề này, đặc biệt là với tin tức về việc phát triển GAI duy nhất trên nhiều trung tâm dữ liệu.

• Thành tựu này cho thấy mức độ nỗ lực mà các nhà nghiên cứu Trung Quốc sẵn sàng thực hiện để đảm bảo họ có thể tiếp tục thúc đẩy tham vọng AI của đất nước.

• Huawei đã tuyên bố rằng Trung Quốc sẽ tìm ra cách tiếp tục phát triển AI bất chấp các lệnh trừng phạt của Mỹ, minh chứng cho câu nói "cần thiết là mẹ đẻ của phát minh".

📌 Trung Quốc đã đạt được bước đột phá quan trọng trong lĩnh vực AI bằng cách huấn luyện mô hình AI tạo sinh trên nhiều trung tâm dữ liệu và kiến trúc GPU khác nhau. Thành tựu này giúp Trung Quốc vượt qua các lệnh cấm chip của Mỹ và tiếp tục thúc đẩy tham vọng AI của mình, minh chứng cho khả năng đổi mới và thích ứng của nước này trong lĩnh vực công nghệ.

https://www.tomshardware.com/tech-industry/artificial-intelligence/china-makes-ai-breakthrough-reportedly-trains-generative-ai-model-across-multiple-data-centers-and-gpu-architectures

Không có file đính kèm.

Nguồn tham khảo

127

Semi-Cloud-DC-Green AI chips-hardware-compute 2024-09-30 23:42:27

Việt Nam hút đầu tư trung tâm dữ liệu quy mô lớn, thúc đẩy phát triển AI

• Supermicro (Mỹ) vừa ký biên bản ghi nhớ với Tập đoàn Sovico (Việt Nam) về phát triển trung tâm dữ liệu tại Việt Nam.

• Wally Liaw, Phó chủ tịch cấp cao Supermicro, cho biết công ty đề xuất hợp tác với Việt Nam trong phát triển trung tâm dữ liệu và sản xuất hệ thống máy chủ.

• Google đang cân nhắc xây dựng trung tâm dữ liệu quy mô lớn đầu tiên tại Việt Nam, có thể gần TP.HCM, nhằm đáp ứng nhu cầu của khách hàng dịch vụ đám mây trong và ngoài nước.

• Liên doanh giữa VNG và ST Telemedia Global Data Centres cam kết phát triển 60MW tại TP.HCM.

• CMC Corporation công bố kế hoạch xây dựng trung tâm dữ liệu quy mô lớn tại TP.HCM vào tháng 7/2024.

• Alibaba tiết lộ kế hoạch xây dựng trung tâm dữ liệu tại Việt Nam vào tháng 5/2024.

• Fitch Solutions cho biết Việt Nam đã tự do hóa thị trường trung tâm dữ liệu bằng cách dỡ bỏ giới hạn sở hữu nước ngoài 49%, cho phép đầu tư nước ngoài 100%.

• Dự kiến Việt Nam sẽ có thêm khoảng 100MW công suất trung tâm dữ liệu trong 2 năm tới, so với công suất hiện tại khoảng 30MW.

• Theo báo cáo của Bain & Company, thị trường phần cứng và phần mềm liên quan đến AI dự kiến tăng trưởng 40-55% hàng năm, đạt 780-990 tỷ USD vào năm 2027.

• Khối lượng công việc AI có thể tăng 25-35% mỗi năm đến năm 2027, đòi hỏi mở rộng quy mô các trung tâm dữ liệu lớn trong 5-10 năm tới.

• AI sẽ thúc đẩy tăng trưởng trung tâm dữ liệu từ 50-200MW hiện nay lên hơn 1GW.

• Chi phí xây dựng trung tâm dữ liệu lớn có thể tăng từ 1-4 tỷ USD hiện nay lên 10-25 tỷ USD trong 5 năm tới.

• Những thay đổi này sẽ có tác động lớn đến hệ sinh thái hỗ trợ trung tâm dữ liệu, bao gồm kỹ thuật hạ tầng, sản xuất điện, làm mát, cũng như gây áp lực lên chuỗi cung ứng.

📌 Việt Nam đang trở thành điểm đến hấp dẫn cho đầu tư trung tâm dữ liệu quy mô lớn, với sự tham gia của nhiều tập đoàn công nghệ hàng đầu thế giới. Dự kiến công suất trung tâm dữ liệu sẽ tăng từ 30MW lên 130MW trong 2 năm tới, đáp ứng nhu cầu ngày càng tăng về AI và chuyển đổi số.

https://vir.com.vn/more-investments-planned-for-vietnams-hyperscale-data-centres-115056.html

Không có file đính kèm.

Nguồn tham khảo

143

AI chips-hardware-compute Semi-Cloud-DC-Green 2024-09-30 23:38:59

Google đầu tư 1 tỷ USD vào Thái Lan: xây trung tâm dữ liệu, thúc đẩy AI và đám mây

• Google công bố kế hoạch đầu tư 36 tỷ baht Thái (khoảng 1 tỷ USD) vào Thái Lan để xây dựng trung tâm dữ liệu mới và mở rộng cơ sở hạ tầng đám mây.

• Đây là trung tâm dữ liệu đầu tiên của Google tại Thái Lan, sẽ được xây dựng ở tỉnh Chonburi phía đông nước này.

• Khoản đầu tư này đánh dấu sự mở rộng của Google tại châu Á, đặt trí tuệ nhân tạo (AI) vào trọng tâm chiến lược quốc tế của công ty.

• Trung tâm dữ liệu mới sẽ hỗ trợ nhu cầu ngày càng tăng về Google Cloud, các đổi mới AI, cũng như các dịch vụ phổ biến như Google Search, Google Maps và Google Workspace tại Thái Lan.

• Ngoài phát triển cơ sở hạ tầng, khoản đầu tư 1 tỷ USD còn nhằm mở ra cơ hội mới cho doanh nghiệp, giáo dục và người dân Thái Lan.

• Google nhấn mạnh tầm quan trọng của việc đào tạo và nâng cao kỹ năng cho người Thái để sử dụng công nghệ AI khi nó đang chuyển đổi các ngành công nghiệp.

• Theo báo cáo của Google, Temasek và Bain & Company năm 2023, nền kinh tế số của Thái Lan là lớn thứ hai ở Đông Nam Á và dự kiến đạt 50 tỷ USD vào năm 2025.

• Google đang đầu tư vào khu vực này với trọng tâm là AI khi phải đối mặt với áp lực từ các đối thủ công nghệ lớn trong lĩnh vực AI và điện toán đám mây.

• Công ty đang phải đối mặt với mối đe dọa từ sự gia tăng của các công cụ AI tạo sinh như ChatGPT của OpenAI.

• Tuần trước, Google đã đệ đơn kiện chống độc quyền lên Ủy ban Châu Âu, cáo buộc Microsoft lạm dụng vị trí thống lĩnh trong ngành công nghiệp đám mây để cản trở cạnh tranh.

📌 Google đầu tư 1 tỷ USD vào Thái Lan, xây dựng trung tâm dữ liệu đầu tiên tại Chonburi và mở rộng cơ sở hạ tầng đám mây. Khoản đầu tư nhằm thúc đẩy AI, hỗ trợ nhu cầu dịch vụ đám mây, mở ra cơ hội mới cho doanh nghiệp và giáo dục tại quốc gia có nền kinh tế số lớn thứ 2 Đông Nam Á.

https://www.cnbc.com/2024/09/30/google-to-invest-1-billion-in-thailand-data-center-and-ai-push.html

Không có file đính kèm.

Nguồn tham khảo

126

AI chips-hardware-compute AI market 2024-09-30 23:34:07

Tạp chí TIME: Phỏng vấn CEO Lisa Su của AMD tiết lộ chiến lược tăng trưởng, tập trung vào AI

- Lisa Su dẫn dắt AMD từ năm 2014, khi giá cổ phiếu chỉ khoảng 3 USD, tăng lên trên 160 USD vào tháng 9 năm 2024, đạt giá trị thị trường hơn 260 tỷ USD.
- Tập trung vào sản xuất CPU cho laptop và PC, cùng GPU cho máy chơi game và các thiết bị điện tử khác.

- Đầu tư vào trí tuệ nhân tạo
- Ra mắt chip AI MI300 vào tháng 12 năm 2023, được xem là sản phẩm tăng trưởng nhanh nhất của AMD.
- MI300X được đánh giá là bộ tăng tốc AI tiên tiến nhất trong ngành, cạnh tranh trực tiếp với Nvidia H100.
- AMD xem AI là toàn diện trong mọi sản phẩm, từ máy tính cá nhân đến các trung tâm dữ liệu đám mây.

- Chính sách mua lại mở rộng
- Mua lại Xilinx, thương vụ mua bán bán dẫn lớn nhất tính đến nay.
- Mua Pensando với giá 1,9 tỷ USD, công ty chuyên về mạng trung tâm dữ liệu.
- Mua ZT Systems và Silo AI, lab AI lớn nhất châu Âu, tăng cường khả năng AI tạo sinh nâng cao truy xuất dữ liệu ngoài.

Hợp tác chiến lược và đối tác
- Hợp tác với Microsoft, Meta, Oracle trong việc phát triển các giải pháp AI.
- Tạo nền tảng AI từ cốt lõi, cung cấp cả phần cứng và phần mềm cho khách hàng toàn cầu.

Tầm nhìn tương lai và dự đoán
- Dự đoán AI sẽ là động lực chính thúc đẩy năng suất kinh tế trong 5 năm tới.
- Tin rằng AI sẽ giúp giải quyết các vấn đề khó khăn như nghiên cứu y học và chẩn đoán bệnh nhanh hơn.
- Nhấn mạnh tầm quan trọng của năng lực tính toán trong việc phát triển các mô hình AI ngày càng phức tạp.

Chính sách và địa chính trị
- AMD duy trì sự tuân thủ nghiêm ngặt các quy định xuất khẩu toàn cầu.
- Đầu tư vào khả năng sản xuất linh hoạt để đối phó với các vấn đề địa chính trị.
- Mở rộng thị trường tại Trung Quốc và các khu vực khác trên toàn thế giới.

Lãnh đạo nữ trong ngành công nghệ
- Lisa Su khuyến khích cơ hội cho phụ nữ trong công nghệ thông qua các sáng kiến lãnh đạo.
- Thúc đẩy sự đa dạng và tạo điều kiện cho nhân tài nữ tỏa sáng trong ngành.

📌 AMD dưới sự lãnh đạo của Lisa Su đã đạt được những bước tiến vượt bậc với chiến lược tập trung vào AI và các đợt mua lại chiến lược, nâng cao giá trị thị trường lên hơn 260 tỷ USD. Tầm nhìn về một tương lai AI toàn diện cùng với hợp tác chiến lược đã định hình AMD trở thành một nhà lãnh đạo trong công nghệ cao.

https://time.com/7026241/lisa-su-amd-ceo-interview/

#TIME

Không có file đính kèm.

Nguồn tham khảo

112

AI chips-hardware-compute 2024-09-30 04:04:52

Khám phá xu hướng mới trong lĩnh vực chip AI và bộ tăng tốc, vượt xa GPU truyền thống

• Các trung tâm dữ liệu đang tích hợp các chip chuyên dụng và "đồng xử lý" để tăng cường khả năng xử lý các tác vụ AI phức tạp.

• GPU chiếm 74% thị phần đồng xử lý cho các ứng dụng AI trong trung tâm dữ liệu năm ngoái, dự kiến đạt doanh thu 102 tỷ USD vào năm 2028.

• Tuy nhiên, chi phí sở hữu GPU rất cao. Ví dụ: một máy chủ với 36 chip GB200 của Nvidia có thể lên tới 2 triệu USD.

• Nhiều doanh nghiệp đang tìm kiếm các giải pháp thay thế hiệu quả về chi phí cho các tác vụ AI cường độ thấp và trung bình.

• Các bộ xử lý và bộ tăng tốc AI chuyên dụng đang nổi lên như một giải pháp thay thế, tập trung vào các chức năng AI cụ thể.

• 3 kiến trúc chính bao gồm: Mạch tích hợp chuyên dụng (ASIC), Mảng cổng có thể lập trình (FPGA) và Đơn vị xử lý thần kinh (NPU).

• ASIC được xây dựng tùy chỉnh cho một tác vụ cụ thể, FPGA có thể được cấu hình lại, còn NPU chỉ tập trung vào việc tăng tốc các tác vụ AI/ML.

• Các bộ tăng tốc, đặc biệt là ASIC và NPU, có thể hiệu quả hơn GPU về chi phí và mức tiêu thụ điện năng.

• IBM đang sử dụng cả GPU và bộ tăng tốc AI từ nhiều nhà cung cấp như Nvidia và Intel trong hệ thống đám mây lai của mình.

• Các máy chủ ảo IBM Cloud sử dụng bộ tăng tốc Gaudi 3 của Intel cho các tác vụ suy luận và yêu cầu bộ nhớ cao.

• Nhiều startup như Groq, Graphcore, SambaNova Systems và Cerebras Systems cũng đang phát triển các sản phẩm bộ tăng tốc AI chuyên dụng.

• Tractable, một công ty phát triển AI để phân tích thiệt hại tài sản, đã đạt được hiệu suất tăng gấp 5 lần khi sử dụng hệ thống IPU-POD của Graphcore so với GPU.

• Các bộ xử lý AI cũng đang được sử dụng cho các tác vụ huấn luyện AI trong một số trường hợp.

• Việc lựa chọn bộ tăng tốc AI phù hợp phụ thuộc vào quy mô và loại tác vụ, dữ liệu, khả năng lặp lại/thay đổi liên tục và nhu cầu về chi phí và tính sẵn có.

• Các chuyên gia khuyến nghị nên chạy các bài kiểm chuẩn để đánh giá lợi ích về hiệu suất và chi phí trước khi đưa ra quyết định.

• Thị trường phần cứng AI tổng thể, bao gồm chip AI, bộ tăng tốc và GPU, dự kiến sẽ tăng trưởng 30% hàng năm, đạt 138 tỷ USD vào năm 2028.

📌 Thị trường chip AI đang phát triển đa dạng với sự xuất hiện của các bộ xử lý và tăng tốc chuyên dụng như ASIC, FPGA và NPU. Các giải pháp này hứa hẹn mang lại hiệu quả chi phí và năng lượng cao hơn so với GPU truyền thống cho nhiều tác vụ AI cụ thể. Dự kiến thị trường phần cứng AI sẽ đạt 138 tỷ USD vào năm 2028, tăng trưởng 30% hàng năm.

https://venturebeat.com/data-infrastructure/going-beyond-gpus-the-evolving-landscape-of-ai-chips-and-accelerators/

Không có file đính kèm.

Nguồn tham khảo

131

HTS AI chips-hardware-compute 2024-09-30 03:43:08

Xây dựng cơ sở hạ tầng AI an toàn và có quản trị cho tương lai

• Xây dựng cơ sở hạ tầng AI đòi hỏi cân bằng giữa bảo mật và quản trị để khai thác tiềm năng của AI mang lại hiệu quả, tiết kiệm chi phí và hiểu sâu hơn về khách hàng.

• Cơ sở hạ tầng AI cần được thiết kế linh hoạt để thích ứng với sự thay đổi của doanh nghiệp. Bảo mật phải bảo vệ doanh thu và quản trị phải đồng bộ với việc tuân thủ nội bộ và trên toàn bộ phạm vi hoạt động của công ty.

• Các thành phần cốt lõi của cơ sở hạ tầng AI cần được củng cố liên tục. Bảo mật, quản trị và tuân thủ cần chia sẻ nền tảng dữ liệu chung để có thông tin chi tiết theo thời gian thực.

• Cơ sở hạ tầng AI mạnh mẽ giúp tự động hóa kiểm toán, tìm ra các trở ngại và xác định những khoảng trống lớn nhất trong bảo mật, quản trị và tuân thủ.

• Các tổ chức cần triển khai các biện pháp bảo vệ phù hợp để đổi mới an toàn với AI, do thiếu các khung quản trị hoặc tuân thủ được ngành công nghiệp phê duyệt.

• Các nhóm tội phạm mạng và các quốc gia đang nhắm mục tiêu vào cơ sở hạ tầng AI của các quốc gia và công ty. Các biện pháp bảo mật hiệu quả bao gồm thủy vân cho mô hình và công cụ phát hiện bất thường dựa trên AI.

• Mô hình là bề mặt đe dọa rủi ro cao của cơ sở hạ tầng AI. 73% doanh nghiệp đã triển khai hàng trăm hoặc hàng nghìn mô hình.

• Thiết kế hướng tới sự tin cậy cần được đặt ở trung tâm của cơ sở hạ tầng AI, với các mục tiêu thiết kế cụ thể như trách nhiệm giải trình, khả năng giải thích, công bằng, mạnh mẽ và minh bạch.

• Quản trị đóng vai trò quan trọng trong cơ sở hạ tầng AI, đảm bảo các hệ thống và mô hình AI được phát triển, triển khai và duy trì một cách có đạo đức, an toàn và có trách nhiệm.

• Các tổ chức cần chịu trách nhiệm về cách cơ sở hạ tầng AI của họ giám sát, kiểm soát và cải thiện để giảm thiểu và loại bỏ thiên kiến.

• IBM đã thiết lập một khung quản trị bao gồm các "điểm trọng tâm" - các giám đốc cấp trung có chuyên môn về AI - để xem xét các dự án đang phát triển nhằm đảm bảo tuân thủ các Nguyên tắc về Tin cậy và Minh bạch của IBM.

• AI có thể giải thích được đang nổi lên như một xu hướng quan trọng để cải thiện tính minh bạch của mô hình và khắc phục sự thiên vị.

📌 Xây dựng cơ sở hạ tầng AI an toàn và có quản trị đòi hỏi cân bằng giữa bảo mật và quản trị. Các biện pháp quan trọng bao gồm thủy vân mô hình, phát hiện bất thường dựa trên AI và thiết kế hướng tới sự tin cậy. 73% doanh nghiệp đã triển khai hàng trăm hoặc hàng nghìn mô hình AI, đòi hỏi quản trị và giảm thiểu thiên kiến chặt chẽ.

https://venturebeat.com/security/building-and-securing-a-governed-ai-infrastructure-for-the-future/

Không có file đính kèm.

Nguồn tham khảo

124

AI chips-hardware-compute 2024-09-30 03:18:51

Google ra mắt Alphachip: AI thiết kế chip trong vài giờ, thách thức cả chuyên gia lành nghề

• Google vừa công bố phương pháp học tăng cường AlphaChip để thiết kế layout chip. Công nghệ này hứa hẹn tăng tốc đáng kể quá trình thiết kế floorplan chip và tối ưu hóa hiệu suất, công suất và diện tích.

• Thiết kế layout chip truyền thống là giai đoạn dài nhất và tốn nhiều công sức nhất trong phát triển chip. Với GPU phức tạp, quá trình này có thể mất 24 tháng nếu thực hiện bởi con người. Google cho biết AlphaChip có thể tạo layout chip chỉ trong vài giờ.

• AlphaChip sử dụng mô hình học tăng cường, trong đó hệ thống coi việc lập floorplan chip như một trò chơi đặt từng thành phần mạch lên lưới trống. Hệ thống cải thiện khi giải quyết nhiều layout hơn, sử dụng mạng nơ-ron đồ thị để hiểu mối quan hệ giữa các thành phần.

• Từ năm 2020, AlphaChip đã được sử dụng để thiết kế các bộ xử lý TPU của Google, điều khiển nhiều mô hình AI quy mô lớn và dịch vụ đám mây của công ty. Công nghệ này đã cải thiện thiết kế của mỗi thế hệ TPU tiếp theo, bao gồm cả chip Trillium thế hệ thứ 6 mới nhất.

• MediaTek cũng đã áp dụng AlphaChip để phát triển các chip Dimensity 5G được sử dụng rộng rãi trong smartphone. AlphaChip có thể tổng quát hóa trên nhiều loại bộ xử lý khác nhau.

• Google cho biết thành công của AlphaChip đã truyền cảm hứng cho làn sóng nghiên cứu mới về việc sử dụng AI cho các giai đoạn khác nhau của thiết kế chip, bao gồm tổng hợp logic, lựa chọn macro và tối ưu hóa thời gian.

• Trong tương lai, Google thấy tiềm năng của AlphaChip trong việc cách mạng hóa toàn bộ vòng đời thiết kế chip: từ thiết kế kiến trúc đến layout và sản xuất. Điều này có thể dẫn đến các chip nhanh hơn, nhỏ hơn và tiết kiệm năng lượng hơn.

• Hiện tại, các máy chủ của Google và smartphone dựa trên MediaTek Dimensity 5G đang hưởng lợi từ AlphaChip, nhưng trong tương lai ứng dụng có thể mở rộng ra hầu hết mọi thứ.

📌 Google giới thiệu AlphaChip, công nghệ AI thiết kế layout chip trong vài giờ thay vì 24 tháng. Đã được Google và MediaTek áp dụng cho TPU và chip Dimensity 5G. Hứa hẹn cách mạng hóa toàn bộ quy trình thiết kế chip, tạo ra các chip nhanh hơn, nhỏ hơn và tiết kiệm năng lượng hơn.

https://www.tomshardware.com/tech-industry/google-unveils-alphachip-ai-assisted-chip-design-technology-chip-layout-as-a-game-for-a-computer

Không có file đính kèm.

Nguồn tham khảo

132

AI chips-hardware-compute 2024-09-30 02:45:00

Huawei thử nghiệm chip AI Ascend 910C mới nhằm thay thế chip Nvidia

• Huawei đã bắt đầu gửi mẫu bộ xử lý Ascend 910C mới cho các công ty máy chủ lớn ở Trung Quốc để kiểm tra phần cứng và cấu hình.

• Chip 910C là phiên bản nâng cấp của 910B, đang được cung cấp cho các công ty internet lớn của Trung Quốc, vốn cũng là khách hàng chính của Nvidia.

• Huawei đang chạy đua để lấp khoảng trống do Nvidia để lại sau khi Washington cấm công ty chip Mỹ xuất khẩu GPU tiên tiến nhất sang Trung Quốc.

• Chip Ascend 910B của Huawei được cho là ngang bằng với chip A100 phổ biến của Nvidia, trở thành lựa chọn hàng đầu ở nhiều ngành công nghiệp Trung Quốc.

• Giải pháp Ascend của Huawei được sử dụng để đào tạo khoảng một nửa trong số hơn 70 mô hình ngôn ngữ lớn hàng đầu của Trung Quốc tính đến năm ngoái.

• Chủ tịch luân phiên Eric Xu Zhijun của Huawei cho biết công ty đã xây dựng hai mảng kinh doanh điện toán trong 5 năm qua để tạo ra lựa chọn đáp ứng nhu cầu cơ sở hạ tầng AI của doanh nghiệp.

• Huawei thường gộp các giải pháp của mình, yêu cầu khách hàng mua cả giải pháp mạng và lưu trữ khi mua chip AI.

• Nvidia từng bị cấm bán GPU A100 và H100 cho khách hàng Trung Quốc vào tháng 8/2022. Sau đó họ đã sửa đổi thành A800 và H800 để vượt qua hạn chế, nhưng Washington lại cấm xuất khẩu các phiên bản này vào tháng 10/2023.

• Nvidia tiếp tục phát triển GPU H20, L20 và L2 để duy trì thị phần tại Trung Quốc. Ban đầu nhu cầu H20 còn yếu nhưng đã tăng đều đặn trong những tháng gần đây.

• Sử dụng chip tuân thủ quy định của Mỹ quan trọng hơn đối với các nhà cung cấp dịch vụ đám mây lớn của Trung Quốc vì nó cho phép họ tiếp cận hỗ trợ kỹ thuật và dịch vụ bảo trì của Nvidia.

• Nvidia dự kiến sẽ cung cấp hơn 1 triệu GPU H20 tại Trung Quốc trong năm nay, đạt doanh số 12 tỷ USD.

📌 Huawei đang thử nghiệm chip AI Ascend 910C mới với các công ty máy chủ lớn ở Trung Quốc, nhằm thay thế chip Nvidia bị cấm. Dự kiến Nvidia vẫn sẽ cung cấp hơn 1 triệu GPU H20 tại Trung Quốc trong năm nay, đạt doanh số 12 tỷ USD. Cuộc đua phát triển chip AI nội địa của Trung Quốc đang diễn ra quyết liệt.

https://www.scmp.com/tech/big-tech/article/3280306/huaweis-ai-chips-take-another-step-forward-chinese-firms-look-nvidia-alternatives

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute AI pháp lý-quản trị-chủ quyền 2024-09-29 04:21:59

"Sứ mệnh AI Ấn Độ" mở rộng cơ hội cho các công ty nhỏ tham gia

• Chính phủ Ấn Độ đã giảm ngưỡng doanh thu cho các công ty muốn đấu thầu GPU từ 100 crore rupee xuống còn 50 crore rupee (khoảng 6 triệu USD).

• Thay đổi này nhằm đáp ứng yêu cầu của ngành công nghiệp, cho phép cả doanh nghiệp nhỏ tham gia vào gói thầu GPU trị giá 10.000 crore rupee (khoảng 1,2 tỷ USD).

• Theo quy định mới, nhà thầu hoặc đối tác chính phải có doanh thu trung bình hàng năm trên 50 crore rupee trong 3 năm tài chính gần nhất.

• Tarun Dua, CEO của E2E Networks, hoan nghênh sự thay đổi này vì giúp công ty có thể tham gia trực tiếp mà không cần liên danh.

• Sunil Gupta, CEO của Yotta Data Services, cho rằng việc hạ ngưỡng doanh thu và tăng tính linh hoạt sẽ giúp nhiều startup trong lĩnh vực dịch vụ AI dễ dàng tham gia hơn.

• Nhà thầu giờ đây có thể nộp đơn đặt hàng GPU sau 3 tháng trúng thầu, thay vì phải có sẵn khi nộp hồ sơ. Tuy nhiên, cần nộp bảo lãnh ngân hàng 50-100 crore rupee.

• Một số chuyên gia cho rằng yêu cầu bảo lãnh ngân hàng vẫn khó khăn cho các công ty nhỏ, chỉ phù hợp với doanh nghiệp lớn.

• Chính phủ sẽ trao điểm thưởng cho các công ty đã đầu tư sớm vào cơ sở hạ tầng GPU, với 1 điểm cho mỗi 20 đơn vị tính toán AI trên 50, tối đa 15 điểm.

• Các nhà thầu phải tuân thủ hướng dẫn "Make in India" của Bộ Thương mại và Công nghiệp.

• Yêu cầu mới về hiệu quả sử dụng năng lượng (PUE) không quá 1,35 cho các trung tâm dữ liệu cung cấp dịch vụ AI đám mây.

• Nhiều công ty công nghệ lớn như Nvidia, Intel, Microsoft Azure, Amazon Web Services, Google Cloud đã thể hiện sự quan tâm đến gói thầu này.

• Thị trường GPU trong nước được đánh giá là rất tiềm năng nhờ sự bùng nổ của ngành AI.

• Hạn chót nộp hồ sơ dự thầu đã được gia hạn đến ngày 16/10/2024.

📌 Chính phủ Ấn Độ đã điều chỉnh chính sách đấu thầu GPU trị giá 1,2 tỷ USD, tạo cơ hội cho cả doanh nghiệp nhỏ tham gia. Yêu cầu doanh thu giảm còn 6 triệu USD/năm, nhưng vẫn có những rào cản như bảo lãnh ngân hàng lớn. Dự án hứa hẹn thúc đẩy mạnh mẽ ngành AI của Ấn Độ.

https://economictimes.indiatimes.com/tech/artificial-intelligence/small-companies-can-now-chase-indias-giant-ai-dreams/articleshow/113749367.cms

Giải thích về Sứ mệnh IndiaAI:

https://pib.gov.in/PressReleasePage.aspx?PRID=2012375

(ban hành tháng 3/2024)

• Nội các Ấn Độ đã phê duyệt khoản đầu tư hơn 10.300 crore rupee (khoảng 1,24 tỷ USD) cho Sứ mệnh IndiaAI trong 5 năm tới.

• Mục tiêu chính là thúc đẩy hệ sinh thái AI của Ấn Độ thông qua mô hình hợp tác công-tư.

• Kế hoạch bao gồm nhiều sáng kiến quan trọng:
- IndiaAI Compute Capacity: Xây dựng cơ sở hạ tầng tính toán AI tiên tiến với hơn 10.000 GPU.
- IndiaAI Innovation Centre (IAIC): Phát triển các mô hình nền tảng AI bản địa.
- IndiaAI Datasets Platform: Nâng cao khả năng tiếp cận và chất lượng dữ liệu khu vực công.
- IndiaAI Application Development Initiative: Thúc đẩy phát triển ứng dụng AI.
- IndiaAI FutureSkills: Mở rộng giáo dục AI ở cấp đại học và sau đại học.
- IndiaAI Startup Financing: Hỗ trợ tài chính cho các startup AI.
- Safe & Trusted AI: Đảm bảo triển khai AI có đạo đức và đáng tin cậy.

• Bộ trưởng Rajeev Chandrasekhar nhấn mạnh AI sẽ là yếu tố thúc đẩy nền kinh tế số của Ấn Độ.

• Khoản đầu tư này sẽ mang lại lợi ích cho người dân và góp phần mở rộng nền kinh tế Ấn Độ.

• Đặc biệt, các bang như Kerala có tiềm năng lớn về đổi mới AI và startup sẽ được hưởng lợi từ khoản tài trợ này.

• IndiaAI Startup Financing sẽ tạo điều kiện thuận lợi cho các startup AI tiếp cận nguồn vốn từ giai đoạn phát triển sản phẩm đến thương mại hóa.

• IAIC sẽ dẫn đầu trong việc phát triển và triển khai các mô hình nền tảng, tập trung vào Mô hình Đa phương thức Lớn (LMM) bản địa.

• IndiaAI Datasets Platform sẽ nâng cao khả năng tiếp cận, chất lượng và tiện ích của các bộ dữ liệu khu vực công.

• Chương trình IndiaAI FutureSkills sẽ mở rộng phạm vi giáo dục AI, tăng cường khả năng tiếp cận các chương trình AI ở bậc đại học và sau đại học.

• Các phòng thí nghiệm Dữ liệu và AI sẽ được thành lập không chỉ ở các thành phố lớn mà còn ở các thị trấn và thành phố nhỏ hơn.

• Sứ mệnh IndiaAI nhằm mục đích củng cố vị thế lãnh đạo toàn cầu của Ấn Độ trong lĩnh vực AI, thúc đẩy tự chủ công nghệ và dân chủ hóa lợi ích của AI cho toàn xã hội.

Không có file đính kèm.

Nguồn tham khảo

111

AI chips-hardware-compute 2024-09-28 08:26:12

Trung Quốc kêu gọi doanh nghiệp trong nước tránh xa chip Nvidia, thúc đẩy phát triển chip AI nội địa

• Bắc Kinh đang gia tăng áp lực buộc các công ty Trung Quốc mua chip AI sản xuất trong nước thay vì sản phẩm của Nvidia, nhằm mở rộng ngành công nghiệp bán dẫn và đối phó lệnh trừng phạt của Mỹ.

• Các cơ quan quản lý Trung Quốc đã khuyến cáo các công ty không mua chip H20 của Nvidia, được sử dụng để phát triển và chạy các mô hình AI. Đây là hình thức hướng dẫn chứ không phải lệnh cấm hoàn toàn.

• Mục đích là giúp các nhà sản xuất chip AI trong nước như Cambricon Technologies và Huawei giành thêm thị phần, đồng thời chuẩn bị cho các công ty công nghệ địa phương đối phó với các hạn chế bổ sung tiềm tàng từ Mỹ.

• Chính phủ Mỹ đã cấm Nvidia bán các bộ xử lý AI tiên tiến nhất cho khách hàng Trung Quốc vào năm 2022. Nvidia sau đó đã điều chỉnh các phiên bản chip tiếp theo để có thể bán theo quy định của Bộ Thương mại Mỹ.

• Doanh thu từ Trung Quốc của Nvidia trong quý 7/2023 đạt khoảng 3,7 tỷ USD, tăng hơn 30% so với cùng kỳ năm trước, chiếm 12% tổng doanh thu.

• Các nhà thiết kế và sản xuất chip Trung Quốc đang nỗ lực giới thiệu các sản phẩm thay thế Nvidia. Tuy nhiên, chip AI nội địa vẫn thua xa sản phẩm của Nvidia về hiệu năng.

• Một số công ty Trung Quốc đang bỏ qua chỉ thị tránh mua chip H20 và đổ xô mua nhiều hơn trước khi Mỹ áp đặt lệnh trừng phạt mới dự kiến vào cuối năm nay.

• Trung Quốc có ngành AI đang phát triển mạnh mẽ bất chấp các hạn chế của Mỹ. ByteDance và Alibaba đang đầu tư mạnh, trong khi nhiều startup cạnh tranh vị trí dẫn đầu trong phát triển mô hình ngôn ngữ lớn.

📌 Trung Quốc đang thúc đẩy phát triển chip AI nội địa, khuyến khích doanh nghiệp tránh sử dụng chip Nvidia để đối phó lệnh cấm của Mỹ. Dù vậy, chip Nvidia vẫn chiếm ưu thế với doanh thu từ Trung Quốc đạt 3,7 tỷ USD trong quý 7/2023, tăng 30% so với cùng kỳ năm trước.

https://www.bloomberg.com/news/articles/2024-09-27/china-urges-local-companies-to-stay-away-from-nvidia-s-ai-chips

Không có file đính kèm.

Nguồn tham khảo

115

AI chips-hardware-compute Semi-Cloud-DC-Green 2024-09-25 23:52:33

Nebius ra mắt trung tâm dữ liệu AI tại Paris, đầu tư 1 tỷ USD vào châu Âu

• Nebius vừa công bố khai trương trung tâm dữ liệu mới tại Paris, là một trong những trung tâm đầu tiên ở châu Âu cung cấp GPU NVIDIA H200 Tensor Core.

• Công ty này là phiên bản đổi tên của bộ phận châu Âu của Yandex - "Google của Nga". Nebius đang đầu tư hơn 1 tỷ USD để xây dựng cơ sở hạ tầng AI trên toàn châu Âu đến giữa năm 2025.

• Arkady Volozh, CEO và nhà sáng lập Nebius, cho biết trung tâm dữ liệu của công ty ở Phần Lan đã cung cấp các dịch vụ tính toán hiệu năng cao, công cụ và dịch vụ mới nhất cho các nhà phát triển AI.

• Volozh nhắm đến việc biến Nebius thành "phượng hoàng tái sinh" từ những gì còn lại của Yandex sau khi công ty thoái vốn khỏi Nga vào đầu năm nay. Thương vụ trị giá 5,4 tỷ USD là vụ rút lui doanh nghiệp lớn nhất khỏi Nga kể từ khi nước này bắt đầu cuộc chiến toàn diện Ukraine hơn 2 năm trước.

• Nebius đang xây dựng cơ sở hạ tầng để đáp ứng nhu cầu ngày càng tăng về AI, tập trung vào "công nghệ cho các nhà công nghệ" (T2T). Sản phẩm cốt lõi là nền tảng đám mây tập trung vào AI cho các khối lượng công việc AI chuyên sâu.

• Công ty hứa hẹn sẽ là một trong những đơn vị đầu tiên mang nền tảng Blackwell của Nvidia đến với khách hàng vào năm 2025.

• Nebius đã ký thư ý định cho hai trung tâm dữ liệu khác tại các địa điểm mới ở châu Âu chưa được tiết lộ. Họ cũng sẽ mở rộng trung tâm dữ liệu hiện có ở Mäntsälä, phía bắc Helsinki, Phần Lan.

• Trụ sở chính của Nebius đặt tại Hà Lan, nhưng phần lớn nhân viên vẫn là cựu nhân viên Yandex. Volozh nhấn mạnh rằng thách thức của châu Âu trong cuộc đua AI toàn cầu là cạnh tranh về nhân tài, và đây chính là thế mạnh của Nebius với đội ngũ nhân sự tài năng.

📌 Nebius, công ty kế thừa Yandex, đầu tư 1 tỷ USD vào cơ sở hạ tầng AI châu Âu, ra mắt trung tâm dữ liệu tại Paris với GPU NVIDIA H200. Mục tiêu trở thành công ty hàng đầu về hạ tầng AI toàn cầu, cung cấp nền tảng Blackwell của Nvidia vào 2025.

https://thenextweb.com/news/nebius-data-centre-paris-1-billion-usd-investment-europe

Không có file đính kèm.

Nguồn tham khảo

145

AI market AI chips-hardware-compute 2024-09-25 06:57:15

Việt Nam và Mỹ ký kết các MOU trong lĩnh vực năng lượng, trí tuệ nhân tạo và trung tâm dữ liệu

• Các doanh nghiệp Việt Nam và Mỹ đã ký kết các biên bản ghi nhớ (MoU) về hợp tác trong lĩnh vực năng lượng, trí tuệ nhân tạo và trung tâm dữ liệu tại một diễn đàn doanh nghiệp ở Mỹ.

• PetroVietnam đã ký MoU về chuyển giao công nghệ năng lượng với Kellogg Brown & Root, và công ty con PTSC của PetroVietnam ký MoU về hợp tác LNG với Excelerate Energy.

• Tập đoàn Sovico ký MoU về phát triển AI và trung tâm dữ liệu với Supermicro.

• Vietjet ký thỏa thuận hợp tác trị giá 1,1 tỷ USD với Honeywell Aerospace Technologies để cung cấp dịch vụ kỹ thuật hàng không và điện tử hàng không cho đội tàu bay của Vietjet.

• Chủ tịch nước Việt Nam Tô Lâm tham dự diễn đàn và dự kiến sẽ gặp Tổng thống Mỹ Joe Biden vào ngày 27/9 bên lề Đại hội đồng Liên Hợp Quốc tại New York.

• Ông Tô Lâm cho biết hai nước còn nhiều dư địa hợp tác và Việt Nam hy vọng Mỹ sẽ trở thành nguồn đầu tư nước ngoài lớn nhất của Việt Nam.

• Chủ tịch nước Việt Nam kỳ vọng chính phủ Mỹ sẽ sớm công nhận Việt Nam là nền kinh tế thị trường.

• Tháng trước, Bộ Thương mại Mỹ cho biết sẽ tiếp tục phân loại Việt Nam là nền kinh tế phi thị trường. Nếu Việt Nam nộp đơn lại, các cơ quan quản lý Mỹ sẽ mất nhiều tháng để đưa ra quyết định.

• Việt Nam từ lâu đã tìm cách nâng cấp vị thế, điều này sẽ giúp giảm thuế chống bán phá giá đối với các nền kinh tế phi thị trường được xác định là có ảnh hưởng nặng nề của nhà nước.

📌 Việt Nam và Mỹ ký kết nhiều thỏa thuận hợp tác quan trọng trong lĩnh vực năng lượng, AI và hàng không, tổng trị giá lên tới 1,1 tỷ USD. Chủ tịch nước Việt Nam và Tổng thống Mỹ sẽ gặp nhau tại New York, thảo luận về việc công nhận Việt Nam là nền kinh tế thị trường và tăng cường hợp tác đầu tư.

Không có file đính kèm.

133

AI chips-hardware-compute 2024-09-25 02:19:48

Intel tung ra chip AI mới: Xeon 6 tăng gấp đôi hiệu năng, Gaudi 3 mạnh hơn 20%

• Intel vừa ra mắt bộ xử lý Xeon 6 mới với lõi hiệu năng (P-cores) và bộ tăng tốc AI Gaudi 3 để nâng cao khả năng cạnh tranh trong lĩnh vực AI.

• Xeon 6 có thể tăng gấp đôi hiệu năng AI thị giác so với thế hệ trước. Nó có số lõi tăng, băng thông bộ nhớ gấp đôi và khả năng tăng tốc AI được tích hợp trong mỗi lõi.

• Gaudi 3 được tối ưu hóa cho AI tạo sinh quy mô lớn, có 64 lõi bộ xử lý Tensor (TPC) và 8 động cơ nhân ma trận (MME) để tăng tốc tính toán mạng nơ-ron sâu. Nó cũng có 128GB bộ nhớ HBMe2 và 24 cổng Ethernet 200Gb.

• Intel đã hợp tác với IBM để triển khai Gaudi 3 dưới dạng dịch vụ trên IBM Cloud, nhằm giảm tổng chi phí sở hữu và tăng hiệu năng AI.

• 73% máy chủ có GPU tăng tốc sử dụng Intel Xeon làm CPU chủ.

• Intel hợp tác với các OEM hàng đầu như Dell, HPE và Supermicro để phát triển các hệ thống đồng thiết kế phù hợp với nhu cầu cụ thể của khách hàng.

• Các giải pháp tạo sinh được tăng cường bởi truy xuất dữ liệu ngoài (RAG) sẵn sàng cho sản xuất được xây dựng trên nền tảng Open Platform Enterprise AI (OPEA), tích hợp các microservice dựa trên OPEA.

• Intel Tiber Developer Cloud cung cấp hệ thống xem trước của Xeon 6 để đánh giá và thử nghiệm kỹ thuật. Một số khách hàng được truy cập sớm vào Gaudi 3.

• Các dịch vụ mới bao gồm SeekrFlow, một nền tảng AI end-to-end từ Seekr để phát triển ứng dụng AI đáng tin cậy.

• Các bản cập nhật mới nhất có phiên bản mới nhất của phần mềm Intel Gaudi và sổ ghi chép Jupyter được tải sẵn PyTorch 2.4 cùng các công cụ Intel oneAPI và AI 2024.2.

📌 Intel ra mắt chip Xeon 6 và Gaudi 3 AI mới, tăng gấp đôi hiệu năng AI thị giác và 20% thông lượng. Hợp tác với IBM, Dell, HPE để triển khai hệ thống AI hiệu quả. 73% máy chủ GPU dùng Xeon làm CPU chủ, khẳng định vị thế của Intel trong lĩnh vực AI.

https://venturebeat.com/ai/intel-launches-xeon-6-and-gaudi-3-ai-chips-to-boost-ai-and-hpc-performance/

Không có file đính kèm.

Nguồn tham khảo

118

AI chips-hardware-compute 2024-09-20 17:23:18

Sự phát triển của AI sẽ làm trầm trọng thêm tình trạng thiếu hụt đồng

- BHP cảnh báo rằng sự phát triển của trí tuệ nhân tạo (AI) sẽ làm trầm trọng thêm tình trạng thiếu hụt đồng, một kim loại thiết yếu cho chuyển đổi năng lượng sạch.
- Nhu cầu toàn cầu về đồng dự kiến sẽ tăng lên 52.5 triệu tấn vào năm 2050, tăng từ 30.4 triệu tấn vào năm 2021, tương đương với mức tăng 72%.
- Theo CFO của BHP, Vandita Pant, nhu cầu từ các trung tâm dữ liệu và AI có thể đạt thêm 3.4 triệu tấn mỗi năm đến năm 2050.
- Hiện tại, các trung tâm dữ liệu chỉ chiếm dưới 1% nhu cầu đồng, nhưng con số này có thể tăng lên 6-7% vào năm 2050.
- BHP đã thực hiện một cuộc đua để đảm bảo quyền truy cập vào các mỏ đồng, bao gồm cả việc đề nghị không thành công trị giá 39 tỷ bảng Anh cho Anglo American.
- Vào tháng 7, BHP và Lundin Mining đã chi 3 tỷ USD để mua lại công ty thăm dò Filo, với các tài sản liên quan đến tiềm năng đồng.
- Đồng được sử dụng trong nhiều ngành công nghiệp và sản phẩm cần thiết để đạt được mục tiêu phát thải ròng bằng không như cáp điện, xe điện và trang trại năng lượng mặt trời.
- Dự báo về tình trạng thiếu hụt đồng đã khiến nhiều nhà phân tích lo ngại về sự thiếu hụt trong trung hạn đến dài hạn.
- Mặc dù nhu cầu yếu ở Trung Quốc đã ảnh hưởng đến giá đồng trong năm nay, nhưng BHP dự đoán rằng giá sẽ tăng trở lại vào cuối thập kỷ này khi nhu cầu vượt quá cung.
- Giá đồng hiện đang giao dịch khoảng 9.207 USD/tấn, giảm 15% so với đỉnh điểm vào tháng 5.

📌 BHP dự đoán nhu cầu đồng sẽ tăng lên 52.5 triệu tấn vào năm 2050 do sự phát triển của AI và trung tâm dữ liệu. Tình trạng thiếu hụt có thể xảy ra trong những năm cuối của thập kỷ này khi nhu cầu vượt quá cung.

https://www.ft.com/content/da407b47-4133-470a-9574-508cee43e107

#FT

Không có file đính kèm.

Nguồn tham khảo

102

AI chips-hardware-compute AI kiến thức-khóa học 2024-09-20 15:39:19

NPU - bộ xử lý thần kinh, xu hướng mới trong ngành máy tính

• NPU (Neural Processing Unit) là một loại bộ xử lý đặc biệt được tối ưu hóa cho các tác vụ AI và học máy. NPU được tích hợp vào nền tảng bộ xử lý hiện đại như Intel Core Ultra, AMD Ryzen AI và Qualcomm Snapdragon X Elite.

• So với CPU và GPU, NPU nhanh hơn CPU nhưng chậm hơn GPU trong việc xử lý các tác vụ AI. Tuy nhiên, NPU tiêu thụ ít năng lượng hơn nhiều so với GPU, giúp tiết kiệm pin trên laptop.

• Hiệu năng của NPU được đo bằng đơn vị TOPS (nghìn tỷ phép tính mỗi giây). NPU cấp thấp có thể xử lý 10 TOPS, trong khi các NPU mạnh hơn đạt tới 40-50 TOPS.

• Windows Studio Effects là một ví dụ về tính năng sử dụng NPU, cung cấp các hiệu ứng webcam như làm mờ nền và điều chỉnh ánh mắt bằng AI.

• Microsoft đang phát triển các tính năng Copilot+ PC yêu cầu NPU mạnh (tối thiểu 40 TOPS). Các tính năng này sẽ có trên PC sử dụng chip Qualcomm Snapdragon X, AMD Ryzen AI 300 và Intel Core Ultra Series 2.

• Hiện tại, hầu hết các ứng dụng AI phổ biến như ChatGPT, Adobe Firefly vẫn chạy trên đám mây, chưa tận dụng NPU. Tuy nhiên, trong tương lai, việc chạy AI cục bộ trên NPU sẽ giúp tiết kiệm chi phí đám mây và bảo vệ quyền riêng tư dữ liệu.

• Các NPU hiện có trên thị trường:
- Intel Core Ultra Series 1 (Meteor Lake): tối đa 11 TOPS
- Intel Core Ultra Series 2 (Lunar Lake): tối đa 48 TOPS
- AMD Ryzen Pro 7000/8000: 12-16 TOPS
- AMD Ryzen AI 300: tối đa 50 TOPS
- Qualcomm Snapdragon X Elite/Plus: tối đa 45 TOPS

• NPU không chỉ có trên PC mà còn xuất hiện trên smartphone như Apple Neural Engine, Google Tensor và Samsung Galaxy.

• Hiện tại, việc mua PC có NPU vẫn còn rủi ro vì các tính năng AI chưa phát triển đầy đủ. Tuy nhiên, trong tương lai gần, NPU sẽ trở nên quan trọng hơn khi các ứng dụng AI cục bộ phát triển.

• Đối với laptop, nên cân nhắc mua máy có NPU nếu có thể. Với máy tính để bàn, NPU chưa thực sự cần thiết vì Intel chưa tích hợp NPU vào CPU desktop.

📌 NPU là xu hướng mới trong ngành máy tính, hứa hẹn mang lại khả năng xử lý AI tiết kiệm năng lượng. Hiện có 5 dòng NPU chính với hiệu năng từ 11-50 TOPS. Mặc dù các ứng dụng AI cục bộ chưa phổ biến, NPU sẽ ngày càng quan trọng trong tương lai gần.

https://www.pcworld.com/article/2457268/what-the-heck-is-an-npu-anyway-everything-you-need-to-know.html

Không có file đính kèm.

Nguồn tham khảo

138

AI chips-hardware-compute 2024-09-20 00:35:31

Báo cáo mới về AI cho thấy thiếu hụt lưu trữ là thách thức lớn nhất, không phải GPU

• Báo cáo "Xu hướng AI toàn cầu 2024" của S&P Global Market Intelligence khảo sát hơn 1.500 lãnh đạo công nghệ về các xu hướng AI.

• Ứng dụng AI hiện phổ biến trong doanh nghiệp, nhưng việc mở rộng quy mô gặp khó khăn do kiến trúc dữ liệu cũ.

• 88% tổ chức đang tích cực nghiên cứu AI tạo sinh, vượt xa các ứng dụng AI khác như mô hình dự đoán (61%), phân loại (51%), hệ thống chuyên gia (39%) và robot (30%).

• GPU hiệu năng cao là trọng tâm của báo cáo, là yếu tố cơ bản để triển khai nhiều ứng dụng AI.

• Đám mây công cộng hyperscaler là một cách tiếp cận GPU, nhưng nhiều tổ chức chuyển sang đám mây AI chuyên biệt.

• 32% tổ chức sử dụng đám mây GPU cho đào tạo mô hình, 31% cho suy luận.

• Đơn đặt hàng chip Nvidia ngày càng tăng do nhu cầu cao.

• Tình trạng khan hiếm GPU nghiêm trọng ở một số nền kinh tế châu Á - Thái Bình Dương như Ấn Độ, Đài Loan, New Zealand và Australia.

• Tốc độ thay đổi từ khi ChatGPT 3 ra mắt đầu năm 2023 là đáng kinh ngạc.

• Trong chưa đầy 2 năm, ứng dụng AI tạo sinh đã vượt qua tất cả các ứng dụng AI khác trong doanh nghiệp.

• AI tạo sinh định hình một nhóm các nhà lãnh đạo AI mới và thị trường các nhà cung cấp đám mây AI và GPU chuyên biệt.

• Thiếu hụt lưu trữ được coi là thách thức lớn nhất đối với các dự án AI/ML, không phải khan hiếm GPU.

• Kiến trúc dữ liệu cũ là rào cản chính để mở rộng quy mô ứng dụng AI trong doanh nghiệp.

• Báo cáo nhấn mạnh tầm quan trọng của cơ sở hạ tầng lưu trữ hiệu suất cao để hỗ trợ khối lượng dữ liệu lớn cần thiết cho AI.

• Các giải pháp lưu trữ truyền thống gặp khó khăn trong việc đáp ứng yêu cầu về tốc độ và quy mô của AI hiện đại.

• Doanh nghiệp cần đầu tư vào hệ thống lưu trữ tiên tiến để tận dụng tối đa tiềm năng của AI.

📌 Báo cáo cho thấy 88% doanh nghiệp đang tập trung vào AI tạo sinh, vượt xa các ứng dụng AI khác. Thiếu hụt lưu trữ là thách thức lớn nhất, không phải khan hiếm GPU. Kiến trúc dữ liệu cũ cản trở việc mở rộng AI, đòi hỏi đầu tư vào hệ thống lưu trữ hiệu suất cao.

https://www.techradar.com/pro/storage-not-gpus-is-the-biggest-challenge-to-ai-says-influential-report-lack-of-bits-and-bytes-is-what-could-make-or-break-your-aiml-project

Không có file đính kèm.

Nguồn tham khảo

282

AI viễn thông AI chips-hardware-compute 2024-09-19 23:42:11

Nvidia và T-Mobile đang hợp tác để "tái định nghĩa viễn thông" bằng GPU thay vì CPU cho vRAN

• Nvidia và T-Mobile đang hợp tác để "tái định nghĩa ngành viễn thông" bằng cách sử dụng GPU thay vì CPU cho mạng vô tuyến ảo (vRAN).

• CEO Nvidia Jensen Huang cho rằng CPU không đủ khả năng xử lý các tác vụ RAN phức tạp, trong khi GPU của Nvidia có thể đáp ứng yêu cầu.

• Huang giới thiệu giải pháp Layer 1 hoàn chỉnh có tên Aerial, dựa trên nền tảng CUDA để tăng tốc xử lý tín hiệu 5G và chuẩn bị cho 6G.

• Giải pháp của Nvidia kết hợp xử lý tín hiệu và AI trên cùng một nền tảng tính toán, cho phép cải thiện hiệu quả mạng và triển khai các dịch vụ AI mới.

• T-Mobile và Nvidia thành lập "Trung tâm Đổi mới AI-RAN" tại trụ sở T-Mobile ở Bellevue để phát triển công nghệ này.

• Cách tiếp cận mới này có thể ảnh hưởng lớn đến các nhà cung cấp thiết bị mạng truyền thống như Ericsson và Nokia, cũng như đối tác chip của họ.

• Ericsson và Nokia đang đánh giá khả năng sử dụng GPU của Nvidia, nhưng vẫn thận trọng về việc thay đổi chiến lược hiện tại.

• Nokia cho rằng AI-RAN có tiềm năng biến đổi mạng vô tuyến hiện tại thành nền tảng đa mục đích cho cả vô tuyến và dịch vụ AI trong tương lai.

• Tuy nhiên, vẫn còn nhiều thách thức như vấn đề tiêu thụ năng lượng cao của GPU và sự chậm phát triển của điện toán biên.

• Intel đang gặp khó khăn và có tin đồn về việc tái cơ cấu hoặc bán mảng mạng và viễn thông, điều này có thể ảnh hưởng đến thị trường vRAN hiện tại.

• Nvidia đang định vị GPU như giải pháp thay thế cho CPU trong tương lai đối với các ứng dụng tính toán đa năng.

📌 Nvidia và T-Mobile đang thách thức cách tiếp cận truyền thống về vRAN bằng việc sử dụng GPU thay vì CPU. Điều này có thể tác động lớn đến ngành viễn thông, với tiềm năng cải thiện hiệu suất mạng 5G/6G và tích hợp AI. Tuy nhiên, vẫn còn nhiều thách thức cần vượt qua.

https://www.lightreading.com/open-ran/nvidia-and-t-mobile-just-tore-up-intel-s-virtual-ran-rulebook

Không có file đính kèm.

Nguồn tham khảo

128

AI chips-hardware-compute 2024-09-19 23:11:16

Các công ty AI Trung Quốc đang "lách luật" thông minh để vượt qua lệnh cấm chip của Mỹ

• Các mô hình AI hàng đầu hiện nay phụ thuộc vào số lượng lớn GPU (đơn vị xử lý đồ họa) tiên tiến. Các công ty phương Tây dễ dàng tiếp cận GPU, như Meta dự định tích trữ 600.000 GPU H100 của Nvidia trước cuối năm nay.

• Tuy nhiên, các công ty công nghệ Trung Quốc khó tiếp cận GPU do lệnh cấm bán bộ xử lý hiệu năng cao của Mỹ từ tháng 10/2022. Thay vào đó, họ tập trung tối ưu hóa nguồn lực hạn chế.

• DeepSeek, một startup ở Hàng Châu, đã phát triển mô hình DeepSeek-v2.5 có hiệu suất ngang ngửa các mô hình nguồn mở hàng đầu trong lập trình và xử lý ngôn ngữ Anh-Trung. DeepSeek chỉ có khoảng 10.000 GPU cũ của Nvidia.

• DeepSeek sử dụng phương pháp "mixture of experts", chia mô hình thành nhiều mạng chuyên biệt cho từng vấn đề. Mô hình có 236 tỷ tham số nhưng chỉ sử dụng dưới 1/10 cho mỗi lần xử lý thông tin mới. Nó cũng nén dữ liệu đầu vào để xử lý hiệu quả hơn.

• MiniCPM, một mô hình nguồn mở của Đại học Thanh Hoa và startup ModelBest, có hiệu suất xử lý ngôn ngữ tương đương các mô hình lớn hơn dù chỉ có 2,4 tỷ và 1,2 tỷ tham số. MiniCPM cũng kết hợp phương pháp mixture-of-experts và nén dữ liệu đầu vào.

• Kích thước nhỏ giúp MiniCPM phù hợp cho thiết bị cá nhân. Phiên bản di động hỗ trợ đa ngôn ngữ và làm việc với nhiều loại dữ liệu như văn bản, hình ảnh, âm thanh.

• Các công ty phương Tây cũng đang thử nghiệm các phương pháp tương tự:
- FlashAttention-3 của Together.ai, Meta và Nvidia tối ưu hóa cho GPU H100 của Nvidia.
- JEST của Google DeepMind sử dụng dữ liệu chất lượng cao ban đầu trước khi mở rộng sang dữ liệu lớn hơn, chất lượng thấp hơn.
- Microsoft phát hành mô hình nhỏ Phi-3 mini với khoảng 4 tỷ tham số.

• Đối với các công ty Trung Quốc, việc tối ưu hóa hiệu quả là bắt buộc do hạn chế tiếp cận phần cứng. Tuy nhiên, điều này có thể mang lại lợi thế khi thúc đẩy cải tiến hiệu quả.

📌 Lệnh cấm chip của Mỹ đã thúc đẩy các công ty AI Trung Quốc đổi mới, tập trung vào tối ưu hóa phần mềm thay vì phần cứng. Các phương pháp như "mixture of experts", nén dữ liệu đã giúp mô hình nhỏ như DeepSeek-v2.5 và MiniCPM đạt hiệu suất cao. Xu hướng này cũng đang ảnh hưởng đến các công ty phương Tây.

https://www.economist.com/science-and-technology/2024/09/19/chinas-ai-firms-are-cleverly-innovating-around-chip-bans

Không có file đính kèm.

Nguồn tham khảo

114

AI chips-hardware-compute Semi-Cloud-DC-Green 2024-09-19 14:00:41

Trung Quốc: thực trạng lạnh lẽo của trung tâm dữ liệu AI giữa cơn sốt LLM

- Chi phí xây dựng và vận hành các trung tâm tính toán thông minh cho AI đang gia tăng đáng kể, với ước tính lên tới 1 tỷ nhân dân tệ (khoảng 140 triệu USD) mỗi năm cho một trung tâm quy mô lớn.
- Sự phát triển nhanh chóng của AI tạo sinh đã dẫn đến sự gia tăng nhu cầu về sức mạnh tính toán; tuy nhiên, nhiều trung tâm vẫn phải đối mặt với tỷ lệ sử dụng thấp.
- Hơn 30 thành phố ở Trung Quốc đã đầu tư vào việc xây dựng hoặc lập kế hoạch cho các trung tâm tính toán thông minh, nhưng nhiều trong số đó đang hoạt động không hiệu quả.
- Tỷ lệ máy chủ không hoạt động trong các trung tâm dữ liệu Trung Quốc đạt khoảng 42%, cho thấy sự lãng phí tài nguyên lớn.
- Chi phí vận hành hàng năm cho một máy chủ DGX A100 có thể lên tới 825.000 nhân dân tệ (khoảng 115.000 USD), bao gồm cả chi phí khấu hao và điện năng.
- Nhu cầu hiện tại chủ yếu tập trung vào việc đào tạo mô hình cơ bản, trong khi các ứng dụng AI gốc vẫn chưa phát triển mạnh mẽ.
- Mặc dù số lượng mô hình lớn đã tăng lên gấp ba lần trong bốn tháng qua, nhưng số lượng ứng dụng AI gốc vẫn còn rất hạn chế so với thị trường quốc tế.
- Các chuyên gia ngành công nghiệp đang tìm kiếm giải pháp để tối ưu hóa việc sử dụng tài nguyên tính toán thông qua các dịch vụ tính toán theo nhu cầu.
- Việc phát triển và phổ biến các ứng dụng AI gốc là yếu tố then chốt để giải quyết vấn đề lãng phí tài nguyên trong các trung tâm tính toán thông minh.
- Các nhà sản xuất đang áp dụng mô hình "pooling" để chia sẻ tài nguyên giữa nhiều ứng dụng khác nhau nhằm tối ưu hóa hiệu suất sử dụng.

📌Trung Quốc: Sự phát triển của AI tạo sinh đang thúc đẩy nhu cầu về sức mạnh tính toán, nhưng chi phí cao và tỷ lệ sử dụng thấp của các trung tâm tính toán thông minh đang tạo ra thách thức lớn. Cần có sự phát triển mạnh mẽ hơn nữa của các ứng dụng AI gốc để tối ưu hóa tài nguyên và giảm lãng phí.

https://mp.weixin.qq.com/s/BoNXsXTmdgTBABZATQTyow

Không có file đính kèm.

Nguồn tham khảo

135

Semi-Cloud-DC-Green AI chips-hardware-compute 2024-09-19 13:52:20

Trung Quốc thừa công suất các trung tâm dữ liệu AI, do thiết kế kém và nhu cầu không cao

- Trung Quốc đang trải qua tình trạng dư thừa công suất tại các trung tâm dữ liệu AI do sự gia tăng nhanh chóng trong đầu tư và xây dựng.
- Các nhà cung cấp trung tâm dữ liệu đã xây dựng quá nhiều cơ sở mà không có đủ kỹ năng để thực hiện các quy trình AI phức tạp.
- Dự báo cho thấy Trung Quốc sẽ thiết lập 50 trung tâm tính toán thông minh vào năm 2025, tăng công suất tính toán lên một phần ba trong 4 năm tới.
- Hiện tại, có khoảng 70 trung tâm mới đang được xây dựng, nhưng nhiều trong số đó đang hoạt động dưới công suất tối ưu.
- Trung tâm dữ liệu AI sử dụng GPU và các loại chip khác để xử lý khối lượng công việc lớn đồng thời, tiêu thụ năng lượng gấp 4 lần so với các trung tâm dữ liệu truyền thống.
- Một báo cáo chỉ trích rằng thị trường đã "tiến nhanh một cách mù quáng" trong việc xây dựng trung tâm dữ liệu và đã đánh giá quá cao nhu cầu.
- Chi phí vận hành một trung tâm dữ liệu thông minh với 1.250 máy chủ hỗ trợ đào tạo và suy diễn mô hình lớn có thể lên tới 1 tỷ nhân dân tệ (khoảng 141 triệu USD) mỗi năm.
- Sáng kiến Tính toán Đông-Tây của Trung Quốc nhằm mục đích xử lý dữ liệu từ các thành phố giàu có ở phía đông tại các tỉnh phía tây, nhưng nhiều cơ sở ở đây lại hoạt động dưới công suất.
- Nhu cầu từ khách hàng ở bờ biển phía đông cho dịch vụ dữ liệu ở phía tây rất yếu, với ít ứng dụng thương mại trưởng thành.
- Các trung tâm dữ liệu mới không thể đáp ứng yêu cầu về độ trễ thấp và quy trình xử lý phức tạp của khách hàng.
- Một vấn đề khác là chi phí mạng cao, với một đường truyền 1Gbit/s có giá lên tới 160.000 nhân dân tệ (khoảng 22.500 USD) mỗi tháng.
- Thiết kế kém của các trung tâm dữ liệu AI cũng gây ra khó khăn trong việc phối hợp giữa tính toán, lưu trữ và mạng lưới.
- Một lãnh đạo của Tencent Cloud so sánh việc này giống như mua một chiếc xe thể thao cao cấp nhưng không hiểu rõ tính năng của nó và thiếu đội ngũ chuyên nghiệp để bảo trì.

📌 Trung Quốc đang đối mặt với tình trạng dư thừa công suất tại các trung tâm dữ liệu AI do thiết kế kém và nhu cầu không như mong đợi. Nhiều cơ sở hoạt động dưới công suất tối ưu, gây lãng phí tài nguyên và chi phí vận hành cao.

https://www.lightreading.com/ai-machine-learning/china-s-hectic-ai-rollout-has-left-data-centers-idling

Không có file đính kèm.

Nguồn tham khảo

130

AI chips-hardware-compute AI market 2024-09-18 21:10:47

Các công ty Trung Quốc đang nỗ lực tạo ra các giải pháp thay thế chip GPU của Nvidia

- Nvidia với các đơn vị xử lý đồ họa (GPU) của mình đã thu hút sự chú ý như một trong những linh kiện phần cứng then chốt để huấn luyện các mô hình trí tuệ nhân tạo khổng lồ như OpenAI.

- Trước nỗ lực của Mỹ hạn chế Trung Quốc tiếp cận các bán dẫn tiên tiến, Bắc Kinh đã tăng cường nỗ lực nuôi dưỡng ngành công nghiệp chip trong nước.

- Một số công ty công nghệ lớn của Trung Quốc như Huawei, Alibaba và Baidu đang cố gắng tạo ra các phương án thay thế cho Nvidia.

- Huawei thiết kế dòng chip máy chủ Ascend dùng cho trung tâm dữ liệu, cạnh tranh với GPU H100 của Nvidia.

- Alibaba và Baidu cũng thiết kế chip AI riêng, lần lượt là Hanguang 800 và Kunlun, đã được triển khai trong các trung tâm dữ liệu và xe tự lái.

- Các startup như Biren Technology, Cambricon Technologies, Moore Threads và Enflame Technology cũng đang nỗ lực trở thành những phương án thay thế Nvidia trong nước.

- Nhiều công ty này đã bị Mỹ đưa vào danh sách đen, hạn chế tiếp cận công nghệ Mỹ.

📌 Trung Quốc đang nỗ lực tạo ra các giải pháp chip AI trong nước thay thế Nvidia, với sự tham gia của các công ty lớn như Huawei, Alibaba, Baidu và một số startup mới nổi, nhằm đáp ứng nhu cầu trí tuệ nhân tạo trong nước và tránh bị Mỹ cắt nguồn cung chip tiên tiến.

https://www.cnbc.com/2024/09/17/chinese-companies-aiming-to-compete-with-nvidia-on-ai-chips.html

Không có file đính kèm.

Nguồn tham khảo

135

AI chips-hardware-compute AI pháp lý-quản trị-chủ quyền 2024-09-18 21:03:05

Microsoft kêu gọi sự rõ ràng về các hạn chế xuất khẩu chip AI đến Trung Đông

- Microsoft đã kêu gọi sự "rõ ràng và nhất quán" từ chính phủ Mỹ về các quy định xuất khẩu chip AI đến Trung Đông.
- Công ty công nghệ này đã đầu tư 1.5 tỷ USD vào G42, một công ty AI lớn nhất tại UAE, nhằm mở rộng thị trường đến châu Á và châu Phi.
- Chính phủ Mỹ đã áp dụng các hạn chế xuất khẩu đối với chip chuyên dụng cho phần mềm AI đến Trung Đông do lo ngại công nghệ này có thể bị chuyển giao cho Trung Quốc.
- Microsoft vẫn chưa nhận được giấy phép cần thiết để vận chuyển các thành phần phục vụ cho kế hoạch hợp tác với G42.
- Brad Smith, chủ tịch và phó chủ tịch của Microsoft, nhấn mạnh rằng cần có sự rõ ràng từ chính phủ Mỹ về các quy định xuất khẩu.
- Dù gặp khó khăn trong việc xin giấy phép xuất khẩu, Microsoft và G42 đã công bố thành lập 2 viện nghiên cứu mới tại Abu Dhabi.
- Các viện này sẽ tập trung vào việc xây dựng hệ thống AI cho thế giới đang phát triển, bao gồm cả ngôn ngữ không phải phương Tây như tiếng Ả Rập và tiếng Hindi.
- Microsoft cam kết đầu tư hàng triệu USD và cung cấp cơ sở hạ tầng máy tính cho một "Phòng thí nghiệm AI vì lợi ích cộng đồng" tại Kenya.
- Các viện nghiên cứu sẽ nhấn mạnh việc sử dụng AI một cách có trách nhiệm để giải quyết các vấn đề xã hội ở các nước đang phát triển.
- Peng Xiao, CEO của G42, khẳng định rằng công ty cam kết phát triển AI một cách có trách nhiệm và an toàn.
- UAE đang nỗ lực để trở thành trung tâm AI toàn cầu, bất chấp mối quan hệ sâu sắc với Bắc Kinh.
- G42 đã cắt đứt quan hệ với các nhà cung cấp Trung Quốc như Huawei để giảm bớt lo ngại từ phía Mỹ.
- Công ty cũng đã áp dụng chính sách không kinh doanh với bất kỳ thực thể nào nằm trong danh sách kiểm soát xuất khẩu của Mỹ.

📌 Microsoft đang nỗ lực hợp tác với G42 để phát triển công nghệ AI tại UAE, nhưng gặp khó khăn do các hạn chế xuất khẩu từ Mỹ. Họ đã đầu tư 1.5 tỷ USD và thành lập hai viện nghiên cứu mới nhằm phục vụ cho thị trường đang phát triển.

https://www.ft.com/content/bb9ed20e-8e95-4808-a37c-7a540ca4b056

#FT

Không có file đính kèm.

Nguồn tham khảo

121

AI chips-hardware-compute 2024-09-17 11:06:33

Ả rập Xê út kỳ vọng sẽ có quyền truy cập vào các chip Nvidia H200 trong năm tới

- Saudi Arabia dự kiến sẽ có quyền truy cập vào các chip hiệu suất cao của Nvidia trong vòng một năm tới, điều này sẽ giúp quốc gia này phát triển các mô hình trí tuệ nhân tạo tiên tiến.
- Abdulrahman Tariq Habib, phó giám đốc điều hành của SDAIA, cho biết việc có được chip Nvidia H200s sẽ rất quan trọng cho Saudi Arabia.
- Chip H200s là loại chip mạnh nhất của Nvidia và được sử dụng trong các mô hình AI như GPT-4 của OpenAI.
- Mỹ đã áp đặt nhiều hạn chế xuất khẩu chip do lo ngại về an ninh quốc gia, đặc biệt là việc Trung Quốc - đối tác thương mại lớn nhất của Saudi Arabia - có thể tiếp cận công nghệ này.
- Saudi Arabia đang đầu tư mạnh mẽ vào hệ sinh thái AI, với mục tiêu AI chiếm 12% GDP vào năm 2030.
- Quỹ Đầu tư Công Saudi Arabia trị giá 925 tỷ USD sẽ dẫn dắt các khoản đầu tư vào lĩnh vực này.
- Các nỗ lực này nằm trong khuôn khổ Vision 2030, một sáng kiến nhằm hiện đại hóa nền kinh tế và đa dạng hóa nguồn thu khỏi dầu mỏ.
- Quỹ Đầu tư Công cũng đang thảo luận với Andreessen Horowitz để thành lập quỹ 40 tỷ USD đầu tư vào AI.
- Việc Mỹ xem xét nới lỏng quy định xuất khẩu cho thấy mối quan hệ tích cực giữa Riyadh và Washington trong lĩnh vực AI.
- Chính quyền Biden đã áp đặt nhiều hạn chế xuất khẩu chip trong hai năm qua để ngăn chặn Trung Quốc tiếp cận công nghệ này.
- Hạn chế xuất khẩu đã mở rộng ra nhiều quốc gia Trung Đông, bao gồm cả Saudi Arabia và UAE.
- Saudi Arabia đang nỗ lực đáp ứng các yêu cầu của Washington liên quan đến mối quan hệ với Trung Quốc và lo ngại về an ninh quốc gia của Mỹ.

📌 Saudi Arabia kỳ vọng có được chip Nvidia H200s trong năm tới để phát triển AI, với mục tiêu AI chiếm 12% GDP vào năm 2030. Mối quan hệ tích cực với Mỹ có thể giúp tháo gỡ hạn chế xuất khẩu công nghệ này.

https://www.cnbc.com/2024/09/13/saudi-arabia-expects-to-get-advanced-nvidia-chips-within-next-year.html

Không có file đính kèm.

Nguồn tham khảo

158

AI chips-hardware-compute Semi-Cloud-DC-Green 2024-09-17 10:28:27

Cerebras vs Nvidia: Cuộc chiến chip AI bùng nổ

- Cerebras Systems đã ra mắt chip CS-3 thế hệ thứ ba vào mùa xuân năm 2024, đánh dấu một bước đột phá trong lĩnh vực AI inference.
- Chip CS-3 sử dụng công nghệ Wafer-Scale Engine (WSE), có kích thước lớn gấp 56 lần GPU lớn nhất hiện nay và chứa 4 triệu tỷ transistor.
- CS-3 có khả năng xử lý 1.800 token mỗi giây cho mô hình Llama 3.1 8B, nhanh hơn nhiều so với các giải pháp dựa trên GPU hiện tại.
- Dự báo thị trường AI inference sẽ đạt 90,6 tỷ USD vào năm 2030, cho thấy nhu cầu ngày càng tăng về công nghệ này.
- Cerebras có giá khởi điểm chỉ 0.10 USD cho mỗi triệu token, tạo ra một lựa chọn cạnh tranh cho các doanh nghiệp.
- Công ty đã nhận được sự chú ý từ các lãnh đạo ngành như Kim Branson từ GlaxoSmithKline và Denis Yarats từ Perplexity nhờ vào tốc độ và hiệu suất vượt trội của CS-3.
- Cerebras đang đối mặt với sự cạnh tranh từ Nvidia và Groq; Nvidia vẫn là nhà cung cấp hàng đầu nhưng đang bị thách thức bởi các sản phẩm mới.
- Groq cũng cung cấp một đơn vị xử lý ngôn ngữ (LPU) tập trung vào AI inference, tuy nhiên không đạt được tốc độ của Cerebras.
- Các doanh nghiệp cần đánh giá lại khối lượng công việc AI của họ để xem liệu họ có thể tận dụng lợi thế từ các chip chuyên dụng như CS-3 hay không.
- Cerebras Cloud cung cấp mô hình giá linh hoạt cho phép người dùng thử nghiệm công nghệ mới mà không cần đầu tư lớn ban đầu.

📌 Các chip chuyên dụng như Cerebras CS-3 đang thay đổi cách thức xử lý AI inference với hiệu suất vượt trội và chi phí hợp lý. Doanh nghiệp nên cân nhắc chuyển đổi để tận dụng những lợi ích này trong bối cảnh thị trường AI ngày càng phát triển.

https://venturebeat.com/ai/how-cerebras-is-breaking-the-gpu-bottleneck-on-ai-inference/

Không có file đính kèm.

Nguồn tham khảo

192

AI chips-hardware-compute Semi-Cloud-DC-Green 2024-09-17 07:48:21

Larry Ellison tuyên bố Oracle sẵn sàng cho giám sát hàng loạt bằng AI

• Larry Ellison, đồng sáng lập Oracle, tuyên bố AI sắp mở ra kỷ nguyên mới của giám sát hàng loạt, và Oracle đã sẵn sàng trở thành nền tảng công nghệ cho các ứng dụng như vậy.

• Ông nói rằng các ứng dụng này sẽ giúp mọi người "cư xử đúng mực" thông qua việc giám sát liên tục bằng AI học máy theo thời gian thực.

• Ellison cho rằng nhiều công ty xây dựng mô hình AI tại Oracle vì "kiến trúc mạng độc đáo" của họ, có từ thời đại cơ sở dữ liệu.

• Ông nhấn mạnh tầm quan trọng của dữ liệu có tổ chức tốt đối với các hệ thống AI, và cho rằng việc các tên tuổi lớn trong điện toán đám mây (và Grok của Elon Musk) chọn Oracle để chạy cơ sở hạ tầng AI của họ là dấu hiệu rõ ràng về sự thành công của Oracle.

• Ellison dự đoán một thế giới nơi máy tính liên tục theo dõi và kiểm soát mọi người. Ông mô tả camera gắn trên người cảnh sát sẽ luôn bật, không thể tắt, với AI được huấn luyện để giám sát bất kỳ điều gì không phù hợp.

• Theo Ellison, điều này có thể ngăn chặn lạm dụng quyền lực của cảnh sát và cứu sống người dân. "Mọi cảnh sát sẽ được giám sát mọi lúc," ông nói.

• Oracle không chỉ muốn tham gia vào việc giám sát cảnh sát. Ellison tuyên bố: "Công dân sẽ cư xử đúng mực vì chúng tôi liên tục ghi hình và báo cáo."

• Ông cũng đề xuất sử dụng drone để truy đuổi nghi phạm thay vì dựa vào các cuộc rượt đuổi bằng xe tuần tra.

• Ellison gợi ý rằng hình ảnh vệ tinh của các trang trại có thể được AI phân tích để dự báo năng suất cây trồng và đề xuất cách cải thiện điều kiện đồng ruộng.

• Oracle muốn tăng thị phần trong lĩnh vực này bất kể những tác động tiềm ẩn đến quyền riêng tư.

📌 Larry Ellison tuyên bố Oracle sẵn sàng trở thành nền tảng cho giám sát AI toàn diện, hứa hẹn kiểm soát hành vi của cả cảnh sát và công dân thông qua ghi hình liên tục. Ông nhấn mạnh vai trò quan trọng của Oracle trong cơ sở hạ tầng AI và dự đoán một tương lai với sự giám sát toàn diện bằng công nghệ.

https://www.theregister.com/2024/09/16/oracle_ai_mass_surveillance_cloud/

Không có file đính kèm.

Nguồn tham khảo

120

AI tương lai AI chips-hardware-compute Semi-Cloud-DC-Green 2024-09-17 07:44:44

CEO của Nvidia, dự báo tương lai AI tại hội nghị Goldman Sachs

• Jensen Huang, CEO Nvidia, phát biểu tại Hội nghị Communacopia + Technology của Goldman Sachs ngày 11/9, thảo luận về tính cạnh tranh của Nvidia, nền tảng Blackwell và Taiwan Semiconductor.

• Cổ phiếu Nvidia tăng hơn 8% sau bài phát biểu, phục hồi đáng kể sau khi giảm mạnh sau báo cáo thu nhập Q2 vào tháng 8.

• Trong Q2 kết thúc ngày 28/7, Nvidia báo cáo:
- Thu nhập điều chỉnh 0,68 USD/cổ phiếu, tăng gấp đôi so với cùng kỳ năm trước
- Doanh thu đạt 30 tỷ USD, tăng 122% so với cùng kỳ năm trước

• Huang tuyên bố Định luật Moore đã kết thúc, nhấn mạnh nhu cầu tăng tốc và thu nhỏ trung tâm dữ liệu.

• Nvidia đang thúc đẩy 2 xu hướng công nghệ chính:
1. Chuyển từ trung tâm dữ liệu dựa trên CPU sang điện toán GPU nhanh hơn
2. Tập trung vào sự phát triển của AI tạo sinh

• Huang dự đoán tương lai nơi mỗi kỹ sư phần mềm sẽ có "kỹ sư kỹ thuật số" đồng hành 24/7.

• Về rủi ro sản xuất chip từ Taiwan Semiconductor, Huang cho biết Nvidia có khả năng chuyển sang nhà cung cấp thay thế nếu cần, mặc dù có thể ảnh hưởng đến chất lượng.

• Huang nhấn mạnh vị trí dẫn đầu của Taiwan Semiconductor trong ngành công nghiệp chip.

• Doanh thu tháng 8 của Taiwan Semiconductor tăng 33% lên 7,8 tỷ USD, cho thấy nhu cầu cao đối với chip AI của Nvidia.

• Huang giới thiệu nền tảng Blackwell, cho phép chạy AI tạo sinh thời gian thực trên các mô hình có hàng nghìn tỷ tham số.

• Khách hàng của Blackwell bao gồm Amazon AWS, Dell, Google, Meta, Microsoft, OpenAI, Oracle và Tesla.

• Blackwell hiện đang sản xuất đầy đủ, dự kiến giao hàng trong Q4 và mở rộng quy mô trong năm tới.

📌 Jensen Huang dự báo tương lai AI tập trung vào cơ sở hạ tầng, không chỉ chip. Nvidia thúc đẩy xu hướng điện toán GPU và AI tạo sinh với nền tảng Blackwell. Doanh thu Q2 tăng 122%, đạt 30 tỷ USD. Blackwell sẽ bắt đầu giao hàng Q4/2024.

https://www.thestreet.com/technology/nvidias-jensen-huang-addressed-three-big-questions-about-ai-future

Không có file đính kèm.

Nguồn tham khảo

137

Semi-Cloud-DC-Green AI chips-hardware-compute 2024-09-16 16:31:48

Đài Loan không thể đơn độc ngăn chặn Trung Quốc tiếp cận chip tiên tiến

- Đài Loan không thể tự mình ngăn chặn Trung Quốc tiếp cận công nghệ chip tiên tiến; cần sự hỗ trợ từ phương Tây.
- Trung Quốc hiện là nước tiêu thụ chip lớn nhất thế giới, trong khi Đài Loan là nhà sản xuất chip hàng đầu và tiên tiến nhất.
- Mối quan hệ giữa Đài Loan và Trung Quốc đang căng thẳng do sự cạnh tranh trong lĩnh vực công nghệ và chuỗi cung ứng bán dẫn.
- Đài Loan đã thực hiện nhiều biện pháp quản lý để bảo vệ công nghệ chip của mình khỏi bị chuyển giao cho Trung Quốc.
- Chính phủ Đài Loan đã áp dụng hệ thống kiểm tra đầu tư ra nước ngoài nhằm giám sát các quyết định đầu tư của các công ty bán dẫn tại đây.
- Từ năm 1993, chính sách "không vội vàng, hãy kiên nhẫn" đã được áp dụng để kiểm soát việc chuyển giao công nghệ sang Trung Quốc.
- Các công ty như TSMC phải trải qua quy trình phê duyệt nghiêm ngặt trước khi mở cơ sở sản xuất tại Trung Quốc.
- Sự gia tăng căng thẳng địa chính trị đã dẫn đến việc Mỹ áp đặt các biện pháp kiểm soát xuất khẩu mới đối với chip và thiết bị sản xuất chip.
- Đài Loan đã cảnh giác với việc Trung Quốc sử dụng kinh doanh để mở rộng ảnh hưởng chính trị tại hòn đảo này.
- Năm 2023, Đài Loan đã công bố danh sách hơn 20 công nghệ cốt lõi mà họ muốn ngăn chặn Bắc Kinh tiếp cận.
- Trong khi đó, ngành công nghiệp chip của Trung Quốc đang phát triển mạnh mẽ, với sản lượng chip nội địa tăng 40% trong quý đầu năm 2024.
- Mặc dù sản xuất chip nội địa của Trung Quốc tăng lên, nhưng họ vẫn phụ thuộc vào Đài Loan cho các chip tiên tiến cần thiết cho AI và điện toán hiệu suất cao.
- Việc hạn chế tiếp cận chuỗi cung ứng chip toàn cầu cho Trung Quốc có thể làm tăng sự tự chủ công nghệ của họ trong tương lai.

📌 Đài Loan đang đối mặt với thách thức lớn trong việc bảo vệ ngành công nghiệp bán dẫn trước sự cạnh tranh từ Trung Quốc. Cần có sự phối hợp quốc tế để đảm bảo an ninh công nghệ và giảm thiểu rủi ro từ những tham vọng của Bắc Kinh.

https://asiatimes.com/2024/09/taiwan-cant-block-chinas-advanced-chip-access-alone/

Không có file đính kèm.

Nguồn tham khảo

113

AI chips-hardware-compute 2024-09-15 05:07:30

Chính phủ Mỹ khuyến khích các công ty như Nvidia và Apple sử dụng dịch vụ đúc chip AI của Intel

• Chính phủ Mỹ đang khuyến khích các công ty như Nvidia và Apple sử dụng dịch vụ đúc chip của Intel cho nhu cầu chip AI, nhằm thiết lập năng lực sản xuất chip AI trong nước.

• CEO Intel Pat Gelsinger đã yêu cầu Bộ trưởng Thương mại Gina Raimondo hỗ trợ thuyết phục các công ty thiết kế chip Mỹ như Apple, Nvidia, Amazon và Google.

• Raimondo đã gặp gỡ các nhà đầu tư công để thuyết phục các công ty rằng việc hỗ trợ sản xuất chip ở Mỹ là vì lợi ích của họ, do rủi ro địa chính trị ngày càng tăng xung quanh Đài Loan.

• Intel đang xây dựng các nhà máy mới ở 4 bang của Mỹ để tăng cường vị thế là nhà cung cấp dịch vụ đúc chip cho các nhà thiết kế chip khác.

• Chính quyền Biden đã thông báo thỏa thuận sơ bộ cung cấp cho Intel tới 8,5 tỷ USD tài trợ trực tiếp thông qua Đạo luật CHIPS and Science. Intel cũng có thể đủ điều kiện nhận tới 11 tỷ USD khoản vay liên bang.

• Tuy nhiên, sáng kiến đúc chip của Intel đã gặp trở ngại. Broadcom gần đây xác định quy trình sản xuất 18A mới của Intel không đáp ứng được tiêu chuẩn chất lượng cần thiết.

• Trong báo cáo thu nhập quý gần nhất, bộ phận đúc chip của Intel báo lỗ 2,8 tỷ USD, tăng từ 1,9 tỷ USD trong Q2/2023 và 2,5 tỷ USD trong Q1/2024. Intel dự kiến lỗ hoạt động của mảng kinh doanh đúc chip sẽ đạt đỉnh vào năm 2024.

• Tuy nhiên, Intel đã đạt được thắng lợi đáng chú ý vào tháng 2 khi công bố Microsoft có kế hoạch sử dụng hoạt động đúc chip của Intel để sản xuất chip điện toán tùy chỉnh với công nghệ 18A.

• Intel cũng kỳ vọng sẽ vượt qua TSMC trong sản xuất chip tiên tiến trước mục tiêu ban đầu là năm 2025. Công ty còn có kế hoạch mở rộng lợi thế này vào năm 2026 với việc giới thiệu quy trình Intel 14A.

• Intel đã tăng dự báo đơn đặt hàng đúc chip từ 10 tỷ USD lên 15 tỷ USD.

📌 Chính phủ Mỹ đang thúc đẩy các công ty công nghệ lớn sử dụng dịch vụ đúc chip AI của Intel. Mặc dù gặp một số thách thức, Intel đã đạt được hợp đồng với Microsoft và kỳ vọng vượt TSMC trong sản xuất chip tiên tiến trước năm 2025, với dự báo đơn hàng đúc chip tăng lên 15 tỷ USD.

https://www.techspot.com/news/104721-us-government-encouraging-likes-nvidia-apple-tap-intel.html

Không có file đính kèm.

Nguồn tham khảo

103

AI chips-hardware-compute 2024-09-12 16:30:37

Cuộc chiến bắt đầu cho tính toán suy luận AI trong trung tâm dữ liệu

- Cuộc chiến về tính toán suy luận AI trong các trung tâm dữ liệu đang diễn ra mạnh mẽ, với sự tham gia của các nhà cung cấp điện toán đám mây lớn và các công ty khởi nghiệp chip AI.
- Các nhà cung cấp điện toán đám mây chủ yếu sử dụng GPU của Nvidia và các bộ tăng tốc tự phát triển, trong khi một số công ty như AMD cũng đang tham gia.
- Chi phí cho suy luận AI trong trung tâm dữ liệu đang là một yếu tố chính cản trở việc triển khai GenAI trong doanh nghiệp, với dự đoán rằng nhu cầu về năng lực suy luận có thể gấp 3 đến 10 lần so với năng lực đào tạo AI hiện tại.
- Để giảm chi phí suy luận, cần phải có phần cứng mạnh mẽ hơn, không chỉ đơn giản là các chip giá rẻ.
- Groq đã giới thiệu hệ thống xử lý suy luận sử dụng 576 đơn vị xử lý ngôn ngữ (LPU), cho phép xử lý 315,06 token mỗi giây, nhanh hơn gấp 10 lần so với hệ thống Nvidia DGX H100.
- Cerebras cũng đã công bố dịch vụ suy luận mới trên nền tảng waferscale CS-2 của mình, với hiệu suất gấp 20 lần so với các API LLM trên đám mây.
- SambaNova tham gia vào cuộc chiến này với hệ thống của mình, đạt hiệu suất 1.100 token mỗi giây cho mô hình Llama 3.1 8B.
- Các công ty khởi nghiệp chip AI đang chuyển hướng sang suy luận, tìm cách chuyển đổi khách hàng từ thuê dịch vụ sang mua hệ thống.
- Mặc dù chi phí suy luận cao, nhưng nếu có thể giảm xuống 1/10 chi phí hiện tại, doanh thu từ suy luận có thể ngang bằng hoặc vượt qua doanh thu từ đào tạo AI.
- Các dịch vụ suy luận đang trở thành chiến lược quan trọng để các công ty khởi nghiệp chip AI kiếm tiền, mặc dù nhiều người vẫn nghi ngờ về khả năng sinh lời của lĩnh vực này.

📌 Suy luận AI đang trở thành một lĩnh vực cạnh tranh khốc liệt với sự tham gia của nhiều công ty, trong đó Groq, Cerebras và SambaNova đang dẫn đầu về hiệu suất và chi phí. Chi phí suy luận cần giảm đáng kể để mở rộng quy mô và thúc đẩy việc áp dụng GenAI trong doanh nghiệp.

https://www.nextplatform.com/2024/09/10/the-battle-begins-for-ai-inference-compute-in-the-datacenter/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2024-09-12 15:51:26

Oracle đang xây siêu máy tính đám mây lớn nhất 'zettascale' với 131.072 GPU Nvidia Blackwell

- Oracle thông báo về việc xây dựng một cụm điện toán đám mây khổng lồ mang tên OCI Supercluster, dự kiến sẽ hỗ trợ lên đến 131.072 GPU Nvidia Blackwell.
- Siêu máy tính này dự kiến sẽ ra mắt trong nửa đầu năm 2025 và được cho là sẽ có hiệu suất tối đa đạt 2,4 zettaflops, mặc dù con số này được tính theo định dạng FP4.
- OCI Supercluster sẽ có số lượng GPU gấp 3 lần siêu máy tính Frontier, hiện đang giữ danh hiệu siêu máy tính mạnh nhất thế giới, và gấp hơn 6 lần so với các đối thủ trong ngành.
- Hiện tại chưa rõ liệu tất cả 131.072 GPU sẽ có mặt ngay khi ra mắt hay không, Oracle đang trong quá trình cung cấp thêm thông tin.
- Mahesh Thiagarajan, Phó Chủ tịch điều hành của Oracle Cloud Infrastructure, nhấn mạnh rằng Oracle có một trong những hạ tầng AI rộng lớn nhất và hỗ trợ khách hàng với các khối lượng công việc AI yêu cầu cao nhất trên đám mây.
- Oracle cung cấp khả năng triển khai dịch vụ đám mây và AI cho khách hàng ở bất kỳ đâu, đồng thời đảm bảo mức độ chủ quyền dữ liệu và AI cao nhất.
- Các cụm OCI nhỏ hơn sử dụng GPU Nvidia H100 cũng đang được triển khai, với khả năng mở rộng lên đến 16.384 GPU và hiệu suất tối đa đạt 65 exaflops.
- Các cụm H200 dự kiến sẽ ra mắt vào cuối năm nay, có khả năng mở rộng đến 65.536 GPU với hiệu suất tối đa đạt 260 exaflops.
- Các cụm OCI Supercluster sử dụng các phiên bản bare-metal làm mát bằng chất lỏng GB200 NVL72 của Nvidia sẽ sử dụng NVLink để cho phép tối đa 72 GPU Blackwell giao tiếp với nhau với băng thông tổng cộng lên tới 129,6 TBps trong một miền NVLink duy nhất.
- Vị trí của cụm siêu máy tính lớn nhất vẫn chưa được công bố.
- Larry Ellison, người sáng lập Oracle, cho biết công ty hiện có 162 trung tâm dữ liệu đám mây đang hoạt động hoặc đang được xây dựng trên toàn cầu, với trung tâm lớn nhất có công suất 800MW.
- Một cơ sở điện 1 gigawatt đang được lên kế hoạch, sẽ được cung cấp năng lượng bởi 3 lò phản ứng hạt nhân nhỏ.

📌 Oracle đang xây dựng OCI Supercluster với 131.072 GPU Nvidia Blackwell, hứa hẹn hiệu suất 2,4 zettaflops. Siêu máy tính này sẽ lớn hơn Frontier gấp ba lần và dự kiến ra mắt trong năm 2025. Công ty hiện có 162 trung tâm dữ liệu toàn cầu.

https://www.datacenterdynamics.com/en/news/oracle-says-it-is-building-a-zettascale-cloud-cluster-with-up-to-131072-nvidia-blackwell-gpus/

Không có file đính kèm.

Nguồn tham khảo

122

AI chips-hardware-compute 2024-09-11 00:04:50

Gartner cảnh báo: AI tạo sinh chỉ phù hợp 5% trường hợp, nhu cầu GPU sẽ giảm

• Erick Brethenoux, chuyên gia nghiên cứu AI hàng đầu của Gartner, cho rằng các kỹ thuật AI đòi hỏi phần cứng chuyên dụng như GPU sẽ "sớm lỗi thời".

• Trong 45 năm quan sát AI, Brethenoux nhận thấy nhiều nhà cung cấp phần cứng chuyên dụng cho AI đều thất bại khi máy tính thông thường có thể đảm nhận công việc.

• Nhu cầu phần cứng chuyên dụng là dấu hiệu của giai đoạn "vũ phu" trong AI, khi kỹ thuật lập trình chưa được tinh chỉnh và cần phần cứng mạnh mẽ.

• Brethenoux tin rằng AI tạo sinh cũng sẽ không thoát khỏi xu hướng này.

• Ông cho rằng các tổ chức có thể hưởng lợi từ AI mà không cần AI tạo sinh. "AI tạo sinh chiếm 90% sự chú ý nhưng chỉ phù hợp với 5% trường hợp sử dụng".

• Giai đoạn cuối 2022 đến đầu 2024 được mô tả là thời kỳ "nghỉ giải lao", khi các bộ phận IT tạm dừng tập trung vào các dự án sinh lời để khám phá AI tạo sinh.

• Các nỗ lực này phần lớn đã đưa các tổ chức quay trở lại với AI họ đã sử dụng trước đó hoặc chuyển sang "AI tổng hợp" - kết hợp AI tạo sinh với các kỹ thuật AI đã được thiết lập như học máy, đồ thị tri thức hoặc hệ thống dựa trên quy tắc.

• Một ví dụ về AI tổng hợp là sử dụng AI tạo sinh để tạo văn bản mô tả kết quả đầu ra của ứng dụng bảo trì dự đoán.

• Bern Elliot, một chuyên gia phân tích khác của Gartner, chỉ ra rằng AI tạo sinh không có khả năng lập luận và chỉ tạo ra "chuỗi xác suất" của nội dung.

• Elliot khuyến nghị không sử dụng AI tạo sinh cho các nhiệm vụ ngoài tạo nội dung, khám phá kiến thức và cung cấp giao diện người dùng hội thoại.

• Mặc dù tỷ lệ "hallucination" của AI tạo sinh đã giảm xuống còn 1-2%, nhưng Elliot cảnh báo rằng điều này không có nghĩa là công nghệ đã trưởng thành.

• Cả Brethenoux và Elliot đều khuyến nghị sử dụng AI tổng hợp như một cách tiếp cận an toàn hơn, và áp dụng các biện pháp bảo vệ sử dụng kỹ thuật AI không tạo sinh để kiểm tra kết quả tạo sinh.

📌 Gartner cảnh báo về sự phát triển quá nóng của AI tạo sinh, dự đoán chỉ phù hợp với 5% trường hợp sử dụng. Chuyên gia khuyến nghị sử dụng AI tổng hợp, kết hợp AI tạo sinh với các kỹ thuật AI truyền thống để đạt hiệu quả tốt hơn và an toàn hơn.

https://www.theregister.com/2024/09/10/brute_force_ai_era_gartner/

Không có file đính kèm.

Nguồn tham khảo

127

AI chips-hardware-compute 2024-09-08 18:45:25

Chip AI của Nvidia rẻ hơn để thuê ở Trung Quốc so với Mỹ

• Chi phí thuê dịch vụ đám mây sử dụng chip AI hàng đầu của Nvidia ở Trung Quốc thấp hơn so với Mỹ, cho thấy các bộ xử lý tiên tiến này dễ dàng tiếp cận thị trường Trung Quốc bất chấp hạn chế xuất khẩu của Washington.

• 4 nhà cung cấp đám mây quy mô nhỏ của Trung Quốc tính phí các công ty công nghệ địa phương khoảng 6 USD/giờ để sử dụng máy chủ với 8 bộ xử lý Nvidia A100 trong cấu hình cơ bản. Các nhà cung cấp đám mây nhỏ ở Mỹ tính phí khoảng 10 USD/giờ cho cùng một cấu hình.

• Giá thấp là dấu hiệu cho thấy nguồn cung chip Nvidia dồi dào ở Trung Quốc và việc phá vỡ các biện pháp của Mỹ nhằm ngăn chặn tiếp cận công nghệ tiên tiến.

• A100 và H100 là những bộ tăng tốc AI mạnh mẽ nhất của Nvidia, được sử dụng để đào tạo các mô hình ngôn ngữ lớn. Nvidia đã bị cấm vận chuyển A100 đến Trung Quốc từ mùa thu năm 2022 và chưa bao giờ được phép bán H100 ở nước này.

• Các nhà bán lẻ chip và startup công nghệ cho biết các sản phẩm này tương đối dễ mua. Hàng tồn kho A100 và H100 được quảng cáo công khai để bán trên mạng xã hội Trung Quốc và các trang thương mại điện tử như Xiaohongshu và Taobao của Alibaba, cũng như tại các chợ điện tử, với mức giá cao hơn một chút so với giá ở nước ngoài.

• Các công ty đám mây lớn hơn của Trung Quốc như Alibaba và ByteDance tính phí gấp đôi đến gấp bốn lần giá của các nhà cung cấp địa phương nhỏ hơn cho các máy chủ Nvidia A100 tương tự.

• Một người sáng lập startup Trung Quốc ước tính có hơn 100.000 bộ xử lý Nvidia H100 trong nước dựa trên tính sẵn có rộng rãi trên thị trường. Các chip Nvidia có kích thước xấp xỉ bằng một cuốn sách, khiến chúng tương đối dễ dàng để những kẻ buôn lậu vận chuyển qua biên giới.

• Tại chợ điện tử Huaqiangbei ở Thâm Quyến, người bán hàng báo giá tương đương 23.000-30.000 USD cho các card cắm H100 của Nvidia. Người bán trực tuyến báo giá tương đương 31.000-33.000 USD.

• Một nhà cung cấp trung tâm dữ liệu ở Trung Quốc cho biết các máy chủ do Supermicro của Thung lũng Silicon sản xuất và được trang bị 8 chip H100 đạt mức giá bán cao nhất là 3,2 triệu nhân dân tệ sau khi chính quyền Biden thắt chặt hạn chế xuất khẩu vào tháng 10. Ông nói rằng giá đã giảm xuống còn 2,5 triệu nhân dân tệ khi các hạn chế về nguồn cung được nới lỏng.

• Nhiều người tham gia vào hoạt động thương mại cho biết các thương nhân ở Malaysia, Nhật Bản và Indonesia thường vận chuyển máy chủ Supermicro hoặc bộ xử lý Nvidia đến Hồng Kông trước khi đưa chúng qua biên giới đến Thâm Quyến.

📌 Chip AI của Nvidia dễ dàng tiếp cận ở Trung Quốc bất chấp lệnh cấm của Mỹ. Giá thuê thấp hơn 40% so với Mỹ (6 USD/giờ so với 10 USD/giờ) cho thấy nguồn cung dồi dào. Ước tính có hơn 100.000 chip H100 tại Trung Quốc, với giá dao động từ 23.000-33.000 USD/chip trên thị trường chợ đen.

https://www.ft.com/content/10aacfa3-e966-4b50-bbee-66e13560deb4

#FT

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2024-09-07 02:06:18

HPE giới thiệu giải pháp triển khai ứng dụng AI một chạm trên đám mây riêng

• HPE đã giới thiệu HPE Private Cloud AI với các giải pháp tăng tốc mới để tự động hóa và hợp lý hóa các ứng dụng trí tuệ nhân tạo.

• HPE Private Cloud AI là một giải pháp đám mây chìa khóa trao tay được đồng phát triển với Nvidia nhằm giúp doanh nghiệp xây dựng và triển khai các ứng dụng AI tạo sinh.

• Giải pháp tăng tốc đầu tiên là trợ lý ảo AI tạo sinh, giúp các nhà phát triển nhanh chóng xây dựng chatbot tương tác trả lời câu hỏi bằng ngôn ngữ tự nhiên, dựa trên dữ liệu riêng của tổ chức và được hỗ trợ bởi các mô hình ngôn ngữ lớn nguồn mở.

• Doanh nghiệp có thể tùy chỉnh ứng dụng AI cho nhiều mục đích sử dụng như hỗ trợ kỹ thuật, tạo báo giá bán hàng và tạo nội dung marketing.

• Phiên bản tiếp theo của trợ lý ảo sẽ hỗ trợ giọng nói, hình ảnh và đa tác vụ, cho phép tạo nội dung nâng cao và thực hiện nhiều tác vụ.

• Các giải pháp tăng tốc trong tương lai sẽ có các ứng dụng AI cho các ngành dọc như tài chính, y tế, bán lẻ, năng lượng và khu vực công.

• Một số giải pháp tăng tốc sắp tới sẽ dựa trên Nvidia NIM Agent Blueprints.

• Các giải pháp tăng tốc là các ứng dụng tùy chỉnh, mô-đun low-code hoặc no-code sử dụng các vi dịch vụ Nvidia NIM, nhằm rút ngắn thời gian tạo giá trị cho doanh nghiệp.

• Các giải pháp này đơn giản hóa việc triển khai ứng dụng AI, vốn thường đòi hỏi kỹ năng mới, khối lượng công việc phức tạp và tích hợp nhiều thành phần khác nhau.

• Các giải pháp tăng tốc được quản lý thông qua đám mây HPE GreenLake, cung cấp các biện pháp bảo vệ doanh nghiệp và cô lập dữ liệu để đảm bảo an ninh.

• HPE cũng đã ra mắt chương trình đối tác Unleash AI để giúp doanh nghiệp tận dụng hơn nữa AI và đẩy nhanh thời gian tạo giá trị.

• Chương trình sẽ bao gồm các nhà cung cấp phần mềm trên các lớp dữ liệu, mô hình AI và ứng dụng AI của ngăn xếp công nghệ, cũng như các nhà tích hợp hệ thống và nhà cung cấp dịch vụ.

📌 HPE ra mắt HPE Private Cloud AI với giải pháp tăng tốc triển khai trợ lý ảo AI tạo sinh chỉ với một cú nhấp chuột. Giải pháp này giúp doanh nghiệp nhanh chóng xây dựng chatbot tương tác dựa trên dữ liệu riêng, có thể tùy chỉnh cho nhiều mục đích sử dụng và được quản lý qua đám mây HPE GreenLake.

https://www.ndtvprofit.com/technology/hpe-introduces-one-click-deploy-ai-applications-in-private-cloud

Không có file đính kèm.

Nguồn tham khảo

140

AI chips-hardware-compute 2024-09-06 05:42:46

Elon Musk kích hoạt siêu máy tính AI Colossus với 100.000 chip Nvidia, tuyên bố mạnh nhất thế giới

• Elon Musk vừa công bố đã kích hoạt siêu máy tính AI mang tên Colossus tại Tennessee, được cho là hệ thống huấn luyện AI mạnh nhất thế giới.

• Colossus được trang bị 100.000 chip Nvidia H100 GPU, nhiều hơn bất kỳ hệ thống AI đơn lẻ nào khác trên thế giới.

• Siêu máy tính này được xây dựng cho công ty khởi nghiệp AI của Musk là xAI, chỉ mất 122 ngày để hoàn thành - một kỷ lục theo Nvidia.

• Musk tuyên bố trong vài tháng tới, Colossus sẽ tăng gấp đôi lên 200.000 chip AI, bao gồm 50.000 GPU H200 mới hơn với gần gấp đôi dung lượng bộ nhớ và băng thông tăng 40%.

• Để có được 100.000 GPU H100 này, ước tính Musk đã phải chi hàng tỷ đô la, với mỗi chip có giá khoảng 40.000 USD.

• xAI mới được thành lập vào mùa hè năm ngoái, với sản phẩm chính là chatbot AI Grok được tích hợp vào X (Twitter).

• Việc xAI có thể sánh ngang về phần cứng với các công ty công nghệ hàng đầu như OpenAI, Microsoft là điều đáng kinh ngạc, giả định rằng Musk không phóng đại.

• Trước đó, Musk đã mua hàng chục nghìn GPU cho Tesla trị giá 3-4 tỷ USD, một số được dùng để huấn luyện phiên bản đầu của Grok.

• xAI đã huy động được khoảng 6 tỷ USD trong đợt gọi vốn tháng 5, nhờ sự hậu thuẫn của các quỹ đầu tư mạo hiểm công nghệ nổi tiếng như Andreessen Horowitz.

• Tuy nhiên, việc ra mắt siêu máy tính này gặp tranh cãi khi người dân địa phương phàn nàn về "mức độ khói bụi không thể chấp nhận được" từ trung tâm dữ liệu.

• Các đối thủ như Microsoft và Meta cũng đang đẩy mạnh đầu tư vào chip AI. Microsoft dự kiến sở hữu 1,8 triệu chip AI vào cuối năm nay, trong khi Meta có kế hoạch mua thêm 350.000 Nvidia H100.

• Colossus sẽ được sử dụng để huấn luyện Grok-3, dự kiến ra mắt vào tháng 12 năm nay.

📌 Elon Musk tạo dấu ấn với siêu máy tính Colossus 100.000 chip Nvidia, tuyên bố mạnh nhất thế giới. Dự án tham vọng trị giá hàng tỷ USD này đặt nền móng cho cuộc đua AI, nhưng cũng gây tranh cãi về tác động môi trường.

https://futurism.com/the-byte/elon-musk-most-powerful-ai-supercomputer

Không có file đính kèm.

Nguồn tham khảo

201

AI chips-hardware-compute 2024-09-05 00:15:59

Phần mềm lỗi của Huawei cản trở nỗ lực thay thế Nvidia trong AI của Trung Quốc

• Nỗ lực của Trung Quốc nhằm bắt kịp sức mạnh tính toán AI của Mỹ đang bị cản trở bởi phần mềm nhiều lỗi, với khách hàng của Huawei phàn nàn về vấn đề hiệu suất và khó khăn khi chuyển đổi từ sản phẩm Nvidia.

• Huawei nổi lên như ứng cử viên hàng đầu trong cuộc đua phát triển giải pháp thay thế trong nước cho Nvidia, sau khi Washington thắt chặt kiểm soát xuất khẩu chip hiệu năng cao vào tháng 10/2022.

• Dòng chip Ascend của Huawei ngày càng được sử dụng phổ biến cho các ứng dụng AI tại Trung Quốc, đặc biệt là cho quá trình suy luận.

• Tuy nhiên, nhiều chuyên gia trong ngành cho biết chip Ascend vẫn thua xa Nvidia trong việc huấn luyện ban đầu các mô hình AI, do vấn đề về độ ổn định, kết nối giữa các chip chậm hơn và phần mềm Cann kém hơn của Huawei.

• Nhân viên của chính Huawei cũng phàn nàn về Cann, cho rằng nó khiến sản phẩm Ascend "khó sử dụng và không ổn định", với lỗi ngẫu nhiên khó xác định nguyên nhân do tài liệu kém.

• Một kỹ sư Trung Quốc cho biết chip của Huawei thường xuyên gặp sự cố, gây khó khăn cho công việc phát triển AI.

• Để giải quyết vấn đề, Huawei đã cử kỹ sư đến hỗ trợ khách hàng chuyển đổi mã huấn luyện từ Cuda sang Cann. Baidu, iFlytek và Tencent nằm trong số các công ty nhận được hỗ trợ.

• Huawei có thể tận dụng lực lượng lao động lớn để đẩy nhanh quá trình chuyển đổi, với hơn 50% trong số 207.000 nhân viên làm việc trong lĩnh vực R&D.

• Sau khi Mỹ thắt chặt kiểm soát xuất khẩu vào tháng 10/2022, Huawei đã tăng giá chip Ascend 910B dùng cho huấn luyện lên 20-30%.

• Khách hàng của Huawei cũng lo ngại về hạn chế nguồn cung chip Ascend, có thể do khó khăn trong sản xuất khi các công ty Trung Quốc bị cấm mua máy móc sản xuất chip tiên tiến từ ASML của Hà Lan.

• Huawei báo cáo doanh thu nửa đầu năm tăng 34%, nhưng không cung cấp chi tiết về doanh số các mảng kinh doanh khác nhau.

• Hơn 50 mô hình nền tảng đã được "huấn luyện và lặp lại" trên chip Ascend, theo chia sẻ của giám đốc điều hành Huawei Zhang Ping'an tại Hội nghị AI Thế giới ở Thượng Hải vào tháng 7/2023.

📌 Huawei đang dẫn đầu nỗ lực thay thế Nvidia trong lĩnh vực AI tại Trung Quốc với chip Ascend, nhưng vẫn gặp nhiều thách thức về phần mềm và hiệu suất. Dù vậy, Huawei đã triển khai hỗ trợ kỹ thuật tích cực và chip Ascend đang được áp dụng ngày càng rộng rãi, với hơn 50 mô hình AI đã được huấn luyện trên nền tảng này.

https://www.ft.com/content/3dab07d3-3d97-4f3b-941b-cc8a21a901d6

#FT

Không có file đính kèm.

Nguồn tham khảo

109

AI viễn thông AI chips-hardware-compute 2024-09-04 21:04:01

Nhà mạng Maxis ra mắt dịch vụ GPU-as-a-Service đầu tiên tại Malaysia

- Maxis đã công bố ra mắt dịch vụ GPU-as-a-Service (GPUaaS) đầu tiên tại Malaysia, nằm trong danh mục dịch vụ điện toán đám mây và quản lý của Maxis Business.
- Dịch vụ GPUaaS cung cấp cho các doanh nghiệp khả năng truy cập dễ dàng vào các đơn vị xử lý đồ họa (GPU) mạnh mẽ, phục vụ cho các ứng dụng AI tiên tiến như đào tạo và suy diễn.
- Maxis cho biết GPUaaS là giải pháp tiết kiệm chi phí cho khách hàng doanh nghiệp, giúp họ nhanh chóng triển khai các khả năng hiệu suất cao cần thiết cho các khối lượng công việc xử lý nặng như AI, học máy và học sâu.
- Doanh nghiệp không cần đầu tư lớn vào phần cứng GPU đắt tiền hay duy trì cơ sở hạ tầng phức tạp khi sử dụng dịch vụ này.
- Dịch vụ GPUaaS của Maxis sẽ sử dụng các cụm GPU Nvidia H100 Tensor Core, với mục tiêu trở thành một trong những nhà cung cấp dịch vụ viễn thông đầu tiên trên thế giới triển khai các siêu chip GB200 Grace Blackwell thế hệ tiếp theo của Nvidia.
- GPUaaS hứa hẹn cung cấp sức mạnh tính toán có thể mở rộng theo yêu cầu, cho phép khách hàng phân bổ nhiều thời gian và tài nguyên hơn cho các hoạt động kinh doanh cốt lõi.
- Dịch vụ này giúp tăng tốc phát triển các mô hình AI tạo sinh (Generative AI), các mô hình ngôn ngữ lớn và các khối lượng công việc AI, nhắm đến nhu cầu ngày càng tăng từ các ngành như sản xuất, chăm sóc sức khỏe và logistics.
- Maxis muốn giúp khách hàng tăng tốc độ tăng trưởng và đổi mới bằng cách truy cập vào các cụm GPU thông qua các kết nối cố định hoặc di động 5G hiện có.
- Dịch vụ GPUaaS của Maxis được hỗ trợ thông qua Bridge Alliance, cho phép Maxis tận dụng dịch vụ GPUaaS của Singtel trong khu vực.
- Theo thỏa thuận chiến lược mà Singtel ký kết vào tháng trước, các nhà khai thác thành viên của Bridge Alliance sẽ có quyền truy cập vào dịch vụ GPUaaS của Singtel, cho phép họ cung cấp dịch vụ điện toán đám mây cho các doanh nghiệp.
- Ngoài Maxis, AIS của Thái Lan và Telkomsel của Indonesia cũng là những người tiên phong trong việc cung cấp dịch vụ GPUaaS trong khu vực.

📌 Maxis đã ra mắt dịch vụ GPU-as-a-Service đầu tiên tại Malaysia, sử dụng GPU Nvidia H100, giúp doanh nghiệp tiết kiệm chi phí và tăng tốc phát triển AI. Dịch vụ này hỗ trợ các ngành như sản xuất, y tế và logistics, với khả năng mở rộng theo nhu cầu.

https://soyacincau.com/2024/09/02/maxis-gpu-as-a-service-malaysia-nvidia-h100-tensor-core/

Không có file đính kèm.

Nguồn tham khảo

118

Semi-Cloud-DC-Green AI chips-hardware-compute 2024-09-04 10:52:06

Tăng trưởng 10% năng lực trung tâm dữ liệu ở Bắc Mỹ và Châu Á trong nửa đầu năm 2024

- Năng lực trung tâm dữ liệu đã tăng 10% trong nửa đầu năm 2024 tại Bắc Mỹ và Châu Á-Thái Bình Dương, theo nghiên cứu mới nhất từ CBRE.
- Bắc Mỹ đã thêm 515MW năng lực mới, với khối lượng xây dựng tăng 70% so với năm trước.
- Northern Virginia là thị trường lớn nhất, bổ sung 357MW, nâng tổng năng lực lên 2.61GW. Dallas-Fort Worth theo sau với 91.6MW, đạt tổng 591MW.
- Tại Châu Á-Thái Bình Dương, nghiên cứu của Cushman & Wakefield cho thấy 11.6GW năng lực đang hoạt động tính đến ngày 30 tháng 6, sau khi thêm 1.3GW trong nửa đầu năm.
- Khu vực này đang trải qua sự mở rộng lớn nhất trong thời gian gần đây, với 4.2GW đang được xây dựng và 12GW đang trong giai đoạn lập kế hoạch.
- Malaysia là thị trường phát triển nhanh nhất trong khu vực, với năng lực hoạt động tăng 80%, chủ yếu tại Johor Bahru, gần Singapore. Ấn Độ ghi nhận mức tăng trưởng thứ hai với 28%.
- Mặc dù có sự tăng trưởng mạnh mẽ, Châu Á-Thái Bình Dương chưa cảm nhận được tác động của AI như Bắc Mỹ.
- Tại Bắc Mỹ, nhu cầu từ AI và đám mây đã đẩy tỷ lệ trống xuống mức thấp kỷ lục 2.8% trong nửa đầu năm, giảm từ 3.3% năm ngoái, trong khi giá tăng trung bình 7%.
- Các thị trường thứ cấp như Denver, Seattle và Austin có tỷ lệ trống giảm xuống 9.7% từ 12.7% năm trước.
- Tại Châu Á-Thái Bình Dương, tỷ lệ trống ở các thị trường lớn dao động từ 8% ở Tokyo và Sydney đến 19% ở Hong Kong, ngoại trừ Singapore với tỷ lệ chỉ 1%.
- CBRE dự báo sẽ có sự gia tăng đầu tư và giao dịch trong nửa cuối năm 2024.
- Tuy nhiên, nhu cầu cao về tính toán năng lượng lớn đang tạo ra sự chênh lệch giá đáng kể giữa các trung tâm dữ liệu mới và cũ, với nhiều cơ sở hiện tại không đủ hạ tầng để đáp ứng nhu cầu này.
- Theo một ghi chú nghiên cứu từ Synergy Research, M&A trung tâm dữ liệu cũng đang gia tăng và có thể vượt 40 tỷ USD trong năm nay, với 36.7 tỷ USD giao dịch đã hoàn tất.

📌 Năng lực trung tâm dữ liệu ở Bắc Mỹ và Châu Á-Thái Bình Dương tăng 10% trong nửa đầu năm 2024, với Bắc Mỹ bổ sung 515MW và Châu Á 1.3GW. Tỷ lệ trống tại Bắc Mỹ giảm xuống 2.8%, trong khi Châu Á ghi nhận tỷ lệ trống từ 8% đến 19%. M&A trung tâm dữ liệu có thể vượt 40 tỷ USD trong năm nay.

https://www.lightreading.com/data-centers/data-center-capacity-in-asia-north-america-grew-10-in-h1

Không có file đính kèm.

Nguồn tham khảo

131

OpenAI ChatGPT AI chips-hardware-compute 2024-09-03 18:45:13

OpenAI dự định sản xuất chip AI riêng trên quy trình 1,6 nm A16 của TSMC

• OpenAI đang lên kế hoạch sản xuất chip AI riêng và đã đặt chỗ sản xuất với TSMC trên quy trình 1,6 nm A16 mới nhất.

• Quy trình A16 sẽ là bước tiếp theo sau quy trình N2 của TSMC, sử dụng transistor nanosheet GAAFET và là quy trình đầu tiên của TSMC áp dụng công nghệ cấp nguồn mặt sau Super Power Rail.

• OpenAI ban đầu dự định sử dụng quy trình N5 chi phí thấp hơn nhưng đã chuyển sang A16 tiên tiến hơn.

• Broadcom hoặc Marvell có thể được chọn để phát triển chip AI cho OpenAI, mặc dù cả hai công ty đều chưa có nhiều kinh nghiệm với các quy trình tiên tiến nhất của TSMC.

• Có khả năng dự án được thực hiện với sự hợp tác của Apple, vốn đang sử dụng ChatGPT trong hệ thống AI của mình và có thể cũng muốn phát triển chip AI riêng.

• OpenAI hiện đang chi rất nhiều tiền để vận hành ChatGPT, một phần do chi phí cao của máy chủ AI Nvidia.

• Việc phát triển chip AI riêng tốn kém ban đầu nhưng sẽ giúp giảm chi phí vận hành lâu dài.

• Tương lai của OpenAI còn nhiều bất ổn do thua lỗ và cạnh tranh gay gắt, nhưng có tin đồn về khoản đầu tư từ Apple và Nvidia.

• Nếu OpenAI bị mua lại bởi Microsoft, Meta hoặc Nvidia, dự án chip riêng có thể sẽ không được hoàn thành.

• Chip của OpenAI nếu ra đời sẽ chỉ tối ưu cho GPT, ít công ty khác quan tâm sử dụng.

• Nvidia hiện đang thống trị thị trường chip AI với các công ty lớn như Alphabet, Amazon, Meta, Microsoft và Tesla chi hàng trăm triệu USD cho các siêu chip Hopper H100 và Blackwell.

• TSMC cho biết A16 là quy trình 1,6 nm nhưng con số này hiện không còn nhiều ý nghĩa.

• Báo cáo từ United Daily News thường khá chính xác về các dự báo công nghệ như vậy.

📌 OpenAI đặt mục tiêu tự sản xuất chip AI trên quy trình 1,6 nm A16 tiên tiến của TSMC, nhằm giảm chi phí vận hành ChatGPT. Dự án có thể hợp tác với Apple, Broadcom hoặc Marvell thiết kế chip. Tuy nhiên, tương lai còn nhiều bất định do cạnh tranh gay gắt và khả năng bị thâu tóm.

https://www.pcgamer.com/software/ai/openai-plans-to-build-its-own-ai-chips-on-tsmcs-forthcoming-16-nm-a16-process-node/

Không có file đính kèm.

Nguồn tham khảo

135

AI chips-hardware-compute 2024-08-31 23:47:16

Microsoft ra mắt chip AI đầu tiên Maia 100, hứa hẹn tăng tốc AI giá rẻ

• Microsoft đã giới thiệu bộ tăng tốc AI đầu tiên của mình có tên Maia 100 tại hội nghị Hot Chips năm nay. Đây là một bước đi nhằm cạnh tranh với sự thống trị của Nvidia trong thị trường chip AI (chiếm 75-90% thị phần).

• Maia 100 được thiết kế để chạy các mô hình OpenAI trên trung tâm dữ liệu Azure của Microsoft. Nó sử dụng kiến trúc tùy chỉnh với bo mạch chủ, giá đỡ và phần mềm riêng để cung cấp giải pháp hiệu quả về chi phí cho các khối lượng công việc dựa trên AI.

• Chip được sản xuất trên quy trình 5nm của TSMC, có TDP 500W và có thể hỗ trợ lên đến 700W. Nó được trang bị 64GB bộ nhớ HBM2E, thấp hơn so với 80GB của Nvidia H100 và 192GB HBM3E của B200.

• Kiến trúc SoC của Maia 100 bao gồm:
- Đơn vị tensor tốc độ cao (16xRx16)
- Bộ xử lý vector siêu vô hướng lỏng lẻo với ISA tùy chỉnh
- Bộ máy Truy cập Bộ nhớ Trực tiếp
- Semaphore phần cứng cho lập trình bất đồng bộ

• Maia 100 hỗ trợ nhiều loại dữ liệu, bao gồm cả định dạng MX độ chính xác thấp của Microsoft.

• Microsoft cung cấp Maia SDK cho các nhà phát triển, bao gồm:
- Công cụ để chuyển đổi nhanh các mô hình từ PyTorch và Triton
- Tích hợp framework, công cụ phát triển, mô hình lập trình và trình biên dịch
- Kernel tính toán và giao tiếp được tối ưu hóa
- Runtime Host/Device Maia
- Lớp trừu tượng phần cứng

• Microsoft đã cung cấp thêm thông tin chi tiết về SDK, giao thức mạng backend và tối ưu hóa trong bài đăng blog "Inside Maia 100".

📌 Microsoft tham gia cuộc đua chip AI với Maia 100, hứa hẹn tăng tốc AI giá rẻ. Chip 5nm này có 64GB HBM2E, TDP 500-700W, hỗ trợ nhiều định dạng dữ liệu và đi kèm SDK toàn diện. Mục tiêu là cạnh tranh với Nvidia trong thị trường chip AI trị giá hàng tỷ USD.

https://www.techspot.com/news/104514-microsoft-maia-100-looks-bring-customers-cost-effective.html

Không có file đính kèm.

Nguồn tham khảo

104

Semi-Cloud-DC-Green AI chips-hardware-compute 2024-08-31 04:29:35

AI thúc đẩy bùng nổ trung tâm dữ liệu, Mỹ dẫn đầu cuộc đua với hơn 2.800 DC

• Ngành trung tâm dữ liệu đang bùng nổ mạnh mẽ nhờ sự phát triển của trí tuệ nhân tạo (AI), trở thành lĩnh vực đầu tư bất động sản hấp dẫn trị giá hàng tỷ USD.

• Mỹ dẫn đầu thế giới với hơn 2.800 trung tâm dữ liệu, so với chỉ khoảng 400 ở Anh. Các công ty công nghệ lớn đang đổ tiền vào cơ sở hạ tầng này.

• Amazon đang đầu tư 35 tỷ USD để mở rộng kinh doanh trung tâm dữ liệu ở Virginia đến năm 2040. Microsoft và OpenAI đang cân nhắc phát triển trung tâm dữ liệu trị giá 100 tỷ USD.

• Nhu cầu về đất để xây dựng trung tâm dữ liệu đang tăng vọt, mang lại lợi ích cho chủ đất địa phương và nguồn thu thuế của các đô thị.

• Bắc Virginia và Thung lũng Silicon là những thị trường hàng đầu. Boise, Reno và Columbus, Ohio đang nổi lên như những thị trường mới đầy tiềm năng.

• Các quỹ đầu tư tư nhân đang hợp tác với nhà cung cấp trung tâm dữ liệu, đưa thêm vốn vào lĩnh vực này.

• Tuy nhiên, người dân thường không muốn sống gần trung tâm dữ liệu vì lo ngại về thẩm mỹ và môi trường, dẫn đến các vụ kiện.

• Các công ty năng lượng đang bị ảnh hưởng bởi nhu cầu điện cao của trung tâm dữ liệu, buộc phải đề xuất tăng giá và gây áp lực lên lưới điện.

• Một số công ty đang hướng tới sử dụng năng lượng tái tạo cho trung tâm dữ liệu để giải quyết vấn đề này.

• Nadeem Meghji của Blackstone Real Estate nhận định trung tâm dữ liệu là loại tài sản hấp dẫn nhất hiện nay.

• Ngoài vai trò công nghệ quan trọng, trung tâm dữ liệu còn là cơ hội đầu tư bất động sản tiềm năng.

• Các công ty có tiềm lực tài chính mạnh như Amazon, Microsoft đang dẫn đầu xu hướng đầu tư vào trung tâm dữ liệu.

• Sự phát triển của AI và nhu cầu tính toán ngày càng tăng là động lực chính thúc đẩy ngành công nghiệp này.

📌 Trung tâm dữ liệu đang bùng nổ nhờ AI, với Mỹ dẫn đầu (2.800 trung tâm). Amazon đầu tư 35 tỷ USD, Microsoft-OpenAI cân nhắc dự án 100 tỷ USD. Tuy có thách thức về môi trường và năng lượng, ngành này vẫn là cơ hội đầu tư bất động sản hấp dẫn.

https://therealdeal.com/national/2024/08/30/ai-set-to-keep-driving-data-center-boom/

Không có file đính kèm.

Nguồn tham khảo

104

AI chips-hardware-compute AI benchmark 2024-08-29 04:27:35

MLPerf Inference 4.1 công bố kết quả mới với sự ra mắt của GPU Nvidia Blackwell

• MLCommons vừa công bố kết quả MLPerf Inference 4.1 mới nhất, với 964 kết quả hiệu năng được gửi bởi 22 tổ chức.

• Đây là lần đầu tiên GPU Nvidia Blackwell thế hệ mới xuất hiện trong các bài kiểm tra được xác thực.

• MLPerf Inference 4.1 giới thiệu benchmark mới về Mixture of Experts (MoE), sử dụng mô hình Mixtral 8x7B gồm 8 chuyên gia, mỗi chuyên gia có 7 tỷ tham số.

• Benchmark MoE kết hợp 3 tác vụ: trả lời câu hỏi dựa trên bộ dữ liệu Open Orca, suy luận toán học sử dụng bộ dữ liệu GSMK và các tác vụ lập trình sử dụng bộ dữ liệu MBXP.

• Nhiều bộ xử lý và hệ thống mới lần đầu xuất hiện trong đợt benchmark này, bao gồm AMD MI300x, Google TPUv6e (Trillium), Intel Granite Rapids, Untether AI SpeedAI 240 và Nvidia Blackwell B200 GPU.

• Kết quả cho thấy GPU Nvidia Blackwell mang lại hiệu năng cao hơn 4 lần so với thế hệ trước đó trên mỗi GPU đối với workload LLM lớn nhất của MLPerf là Llama 2 70B.

• GPU Nvidia Hopper cũng đạt được cải thiện hiệu năng lên tới 27% so với kết quả 6 tháng trước, chỉ nhờ vào tối ưu hóa phần mềm.

• David Kanter, người sáng lập MLPerf tại MLCommons, nhấn mạnh sự đa dạng và số lượng lớn các hệ thống tham gia benchmark lần này, mang lại nhiều cơ hội so sánh và học hỏi cho ngành công nghiệp.

• Miro Hodak từ AMD giải thích rằng cách tiếp cận MoE cho phép triển khai hiệu quả hơn và chuyên biệt hóa tác vụ, mang lại giải pháp AI linh hoạt và tiết kiệm chi phí hơn cho doanh nghiệp.

• Dave Salvator từ Nvidia chia sẻ đây là lần đầu tiên công bố dữ liệu hiệu năng đo lường của Blackwell, thể hiện sự phấn khích về tiềm năng của GPU thế hệ mới này.

• Các kết quả MLPerf Inference cung cấp cái nhìn toàn diện về cảnh quan phần cứng và phần mềm AI đang phát triển nhanh chóng, giúp các nhà ra quyết định doanh nghiệp đưa ra lựa chọn sáng suốt về đầu tư cơ sở hạ tầng AI.

📌 MLPerf Inference 4.1 đánh dấu bước tiến mới trong hiệu năng AI với sự ra mắt của GPU Nvidia Blackwell mạnh gấp 4 lần thế hệ trước. Benchmark MoE mới và sự cải thiện 27% của GPU Hopper cho thấy tiềm năng to lớn của công nghệ AI trong tương lai gần.

https://venturebeat.com/ai/mlcommons-mlperf-inference-4-1-benchmarks-moe-model-as-nvidia-blackwell-makes-its-testing-debut/

Không có file đính kèm.

Nguồn tham khảo

165

AI chips-hardware-compute Semi-Cloud-DC-Green 2024-08-29 03:57:56

AWS ra mắt dịch vụ HPC-as-a-service mới: mở rộng quyền truy cập siêu máy tính cho doanh nghiệp

• AWS giới thiệu dịch vụ mới có tên AWS Parallel Computing Service, nhằm dân chủ hóa quyền truy cập vào điện toán hiệu năng cao (HPC) cho doanh nghiệp (HPC-as-a-service)

• Dịch vụ này cho phép khách hàng AWS truy cập các máy chủ máy tính để thực hiện các khối lượng công việc đòi hỏi tính toán lớn mà không cần đào tạo quản trị viên hệ thống.

• Ian Colle, giám đốc điện toán và mô phỏng nâng cao tại AWS, cho rằng dịch vụ này có thể đẩy nhanh tốc độ đổi mới công nghệ hoặc khám phá khoa học vốn phụ thuộc vào quyền truy cập vào các cụm HPC.

• AWS Parallel Computing cho phép người dùng thiết lập và quản lý các nhóm phiên bản Amazon Elastic Compute Cloud. Công ty đã sử dụng trình quản lý khối lượng công việc HPC nguồn mở Slurm để xây dựng và duy trì các cụm cho quản trị viên hệ thống.

• Khách hàng có thể sử dụng các công cụ tương tự trên AWS như Management Console và bộ công cụ phát triển phần mềm. Vì dịch vụ sử dụng Slurm, người dùng có thể di chuyển bất kỳ quy trình làm việc hiện có nào sang cụm HPC của AWS mà không cần phải thiết kế lại.

• Dịch vụ sẽ được cung cấp đầu tiên tại các khu vực AWS ở Ohio, Virginia và Oregon (Hoa Kỳ); Frankfurt, Stockholm và Ireland (Châu Âu); và Sydney, Singapore và Tokyo (Châu Á-Thái Bình Dương).

• Một số khách hàng AWS đã được truy cập sớm vào Parallel Computing để thể hiện phạm vi các trường hợp sử dụng mà cụm HPC có thể thực hiện. Ví dụ, công ty Marvel Fusion của Đức sử dụng dịch vụ này cho nghiên cứu về năng lượng không phát thải vô hạn.

• Việc cung cấp quyền truy cập vào các cụm HPC đã trở nên phổ biến trong những năm gần đây khi các công ty bắt đầu cần quyền truy cập vào sức mạnh tính toán để đào tạo các mô hình ngôn ngữ lớn và các mô hình AI nền tảng khác.

• Theo Tony Harvey, nhà phân tích và giám đốc cấp cao của Gartner, HPC dưới dạng dịch vụ không phải là mới, nhưng ngày càng có nhiều loại công ty nhìn thấy các trường hợp sử dụng mới cho siêu máy tính.

• Harvey cho rằng bất kỳ động thái nào nhằm dân chủ hóa hơn nữa quyền truy cập vào HPC sẽ giúp giảm thời gian chờ đợi cho các siêu máy tính lớn như siêu máy tính Hewlett Packard Frontier đặt tại Tennessee, vốn có thể mất nhiều tháng để mở cửa.

📌 AWS ra mắt dịch vụ HPC mới giúp doanh nghiệp dễ dàng tiếp cận siêu máy tính. Dịch vụ này sẽ có mặt tại 9 khu vực AWS trên toàn cầu, hứa hẹn thúc đẩy đổi mới trong nhiều lĩnh vực từ khoa học đến công nghệ AI.

https://venturebeat.com/ai/awss-new-hpc-as-a-service-offering-democratizes-supercomputer-access/

Không có file đính kèm.

Nguồn tham khảo

117

AI chips-hardware-compute Semi-Cloud-DC-Green 2024-08-28 20:53:51

Chính phủ Ấn Độ có kế hoạch hồi sinh chính sách trung tâm dữ liệu cũ với các ưu đãi mới cho AI và ML

- Chính phủ Ấn Độ dự kiến sẽ cải tiến chính sách trung tâm dữ liệu được đề xuất vào năm 2020, bổ sung các ưu đãi mới để phù hợp với nhu cầu hiện tại của ngành công nghiệp.
- Một trong những ưu đãi chính là cấp trạng thái hạ tầng cho các trung tâm dữ liệu, tương tự như các lĩnh vực như đường sắt, cảng, đường bộ và điện.
- Bộ Điện tử và Công nghệ Thông tin (MeitY) có thể sẽ cung cấp thêm ưu đãi cho các công ty thiết lập trung tâm dữ liệu AI và ML tiên tiến, yêu cầu các thiết lập lớn hơn và đồng nhất tại cùng một địa điểm.
- Hiện tại, tổng công suất của tất cả các trung tâm dữ liệu trên toàn quốc ước tính khoảng 950 megawatt (MW) và có cơ hội tăng gấp đôi trong vòng 2-3 năm tới.
- Dự báo, cơ hội đầu tư vào các trung tâm dữ liệu có thể đạt khoảng 6-7 tỷ USD vào năm 2026.
- Chính sách mới sẽ khuyến khích các bang cung cấp các khu vực chuyên biệt để thiết lập các công viên trung tâm dữ liệu, với các ưu đãi thuế tùy thuộc vào loại hình xử lý dữ liệu diễn ra tại đó.
- Chính phủ cũng sẽ thảo luận với Bộ Điện lực về các phương án cung cấp điện không bị gián đoạn cho các trung tâm dữ liệu, bao gồm khả năng cho phép các trung tâm này lấy điện từ các bang khác hoặc thị trường mở.
- Một trong những lựa chọn là khuyến khích các bang hoặc các công viên trung tâm dữ liệu tự thiết lập các đơn vị phát điện riêng.
- Vào năm 2020, MeitY đã phát hành dự thảo chính sách trung tâm dữ liệu, đề xuất cấp phép một cửa đơn giản cho các công ty muốn thiết lập hoạt động tại Ấn Độ.
- Dự thảo này cũng đề xuất các ưu đãi bổ sung cho các công ty sử dụng phần cứng CNTT sản xuất trong nước, bao gồm máy chủ, thiết bị lưu trữ và thiết bị mạng.

📌 Chính phủ Ấn Độ đang xem xét hồi sinh chính sách trung tâm dữ liệu từ năm 2020 với các ưu đãi mới cho AI và ML, dự kiến đầu tư đạt 6-7 tỷ USD vào năm 2026. Tổng công suất hiện tại là 950 MW, có khả năng tăng gấp đôi trong 2-3 năm tới.

https://m.economictimes.com/tech/technology/govt-to-revive-2020-draft-data-policy/articleshow/112839984.cms

Không có file đính kèm.

Nguồn tham khảo

122

AI chips-hardware-compute 2024-08-28 09:33:49

Cerebras Systems thách thức Nvidia với chip AI khổng lồ nhanh hơn và rẻ hơn

- Cerebras Systems, một công ty khởi nghiệp của Mỹ, đang phát triển chip Wafer Scale Engine (WSE) kích thước bằng iPad nhằm cạnh tranh với Nvidia trong thị trường GPU AI.
- Vào ngày 27 tháng 8 năm 2024, Cerebras đã công bố dịch vụ Cerebras Inference, cho phép khách hàng sử dụng chip của họ cho các chương trình AI của riêng mình.
- Công ty tuyên bố rằng công nghệ của họ có thể chạy các chương trình AI tạo sinh nhanh gấp 20 lần và chỉ tốn 1/5 chi phí so với các GPU Nvidia như H100.
- Cerebras Inference cho phép các chương trình AI tạo ra dữ liệu mới, ví dụ như dự đoán từ tiếp theo trong một đoạn văn bản.
- Chip WSE của Cerebras đang được sử dụng để vận hành mô hình ngôn ngữ lớn mã nguồn mở Llama 3.1 của Meta, cho phép trả lời gần như không có độ trễ.
- Cụ thể, chip của Cerebras có thể xử lý phiên bản Llama 3.1 với 8 tỷ tham số, sản xuất 1.800 token mỗi giây, tương đương với khoảng 1.300 từ trong một giây.
- Phiên bản mạnh hơn với 70 tỷ tham số của Llama 3.1 có thể tạo ra 450 token mỗi giây, vượt xa hiệu suất của các nhà cung cấp đám mây AI như Amazon AWS và Microsoft Azure.
- Cerebras định giá dịch vụ của mình rất cạnh tranh: 10 cent cho mỗi triệu token cho phiên bản 8B và 60 cent cho phiên bản 70B, trong khi OpenAI tính phí từ 2,50 đến 15 USD cho mỗi triệu token.
- Chip WSE-3 của Cerebras được sản xuất bởi TSMC, nhà sản xuất chip hợp đồng đứng sau GPU AI của Nvidia, với 4 triệu transistor và 900.000 lõi AI.
- Cerebras cho biết WSE-3 cung cấp băng thông bộ nhớ cao gấp 7.000 lần so với H100, với 44GB SRAM trên chip.
- Mặc dù Cerebras đang so sánh WSE-3 với công nghệ Nvidia cũ, Nvidia đã giới thiệu kiến trúc Blackwell mới hứa hẹn hiệu suất gấp 7 đến 30 lần so với H100.
- Cerebras dự kiến mở rộng khả năng truy cập chip WSE-3 cho các nhà cung cấp đám mây khác, mặc dù giá của hệ thống CS-3 lên tới vài triệu USD, cao hơn nhiều so với giá của một GPU H100 khoảng 30.000 USD.

📌 Cerebras Systems đang định hình lại thị trường chip AI với công nghệ WSE-3, hứa hẹn tốc độ nhanh hơn gấp 20 lần và chi phí chỉ bằng 1/5 so với Nvidia. Dịch vụ Cerebras Inference cung cấp giải pháp AI hiệu quả với giá chỉ 10 cent cho mỗi triệu token.

https://www.pcmag.com/news/startup-goes-after-nvidia-with-giant-ai-chips-built-for-speed

Không có file đính kèm.

Nguồn tham khảo

160

AI chips-hardware-compute 2024-08-28 07:09:26

Nous Research ra mắt DisTrO giúp huấn luyện mô hình AI hiệu quả gấp 10.000 lần

• Nous Research vừa công bố công cụ mới có tên DisTrO (Distributed Training Over-the-Internet), giúp giảm đáng kể lượng thông tin cần truyền giữa các GPU trong quá trình huấn luyện mô hình AI.

• DisTrO cho phép huấn luyện các mô hình AI mạnh mẽ bên ngoài các công ty lớn, trên internet công cộng với kết nối cấp độ người dùng, tiềm năng cho phép cá nhân hoặc tổ chức trên toàn cầu cùng hợp tác.

• Kết quả thử nghiệm cho thấy DisTrO tăng hiệu quả gấp 857 lần so với thuật toán huấn luyện phổ biến All-Reduce, đồng thời giảm mạnh lượng thông tin truyền đi trong mỗi bước huấn luyện (86,8 MB so với 74,4 GB).

• DisTrO có thể mở ra cơ hội cho nhiều người hơn có khả năng huấn luyện các mô hình AI cực kỳ mạnh mẽ theo ý muốn.

• Phương pháp này giải quyết vấn đề yêu cầu phần cứng cao trong huấn luyện AI, vốn chỉ có các công ty lớn như Tesla, Meta, OpenAI, Microsoft, Google và Anthropic mới đáp ứng được.

• DisTrO giảm lưu lượng truyền thông giữa các GPU xuống 4-5 bậc độ lớn, cho phép huấn luyện mô hình quy mô lớn trên kết nối internet chậm hơn - tốc độ tải xuống 100Mbps và tải lên 10Mbps.

• Nhóm nghiên cứu đã thử nghiệm DisTrO với kiến trúc mô hình ngôn ngữ lớn Meta Llama 2 1,2 tỷ tham số và đạt hiệu suất huấn luyện tương đương các phương pháp thông thường nhưng với chi phí truyền thông thấp hơn đáng kể.

• Các tác giả cho biết có thể giảm yêu cầu băng thông lên đến 1.000-3.000 lần trong giai đoạn tiền huấn luyện, và lên đến 10.000 lần cho giai đoạn hậu huấn luyện và tinh chỉnh mà không làm giảm đáng kể hiệu suất.

• DisTrO vẫn cần GPU mạnh - cụ thể là 32 GPU H100, nhưng thay vì tập trung tại một địa điểm, chúng có thể được phân tán trên toàn cầu và giao tiếp qua internet người dùng.

• Công nghệ này có thể thay thế các phương pháp huấn luyện hiện có mà không làm giảm chất lượng mô hình, mở ra giải pháp có thể mở rộng và hiệu quả cho huấn luyện phân tán quy mô lớn.

• DisTrO có thể giúp giảm thiểu tác động môi trường của việc huấn luyện AI bằng cách tối ưu hóa việc sử dụng cơ sở hạ tầng hiện có và giảm nhu cầu về các trung tâm dữ liệu khổng lồ.

• Nhóm nghiên cứu Nous Research đang tìm kiếm cộng tác viên để giúp hoàn thiện và mở rộng công nghệ đột phá này. Báo cáo sơ bộ và tài liệu hỗ trợ đã có sẵn trên GitHub.

📌 DisTrO của Nous Research có thể cách mạng hóa việc huấn luyện AI, cho phép mô hình mạnh mẽ được tạo ra bởi cá nhân và tổ chức nhỏ. Công nghệ này giảm yêu cầu băng thông tới 10.000 lần, mở ra tiềm năng cho sự đổi mới AI phi tập trung và toàn cầu.

https://venturebeat.com/ai/this-could-change-everything-nous-research-unveils-new-tool-to-train-powerful-ai-models-with-10000x-efficiency/

Không có file đính kèm.

Nguồn tham khảo

102

AI chips-hardware-compute 2024-08-28 06:51:01

'Friendshoring' đã biến Malaysia thành tâm điểm của cuộc cách mạng AI như thế nào

- Malaysia đang trở thành điểm đến hấp dẫn cho các công ty công nghệ hàng đầu thế giới đầu tư vào lĩnh vực bán dẫn và trung tâm dữ liệu AI, với tổng vốn đầu tư lên tới hàng chục tỷ USD trong thời gian gần đây.
- Đảo Penang của Malaysia hiện đang cạnh tranh với Hàn Quốc và Thung lũng Silicon với tư cách là trung tâm sản xuất chip bán dẫn quan trọng cho cuộc cách mạng AI. Intel đang đầu tư 7 tỷ USD vào các cơ sở mới tại Penang.
- Các nhà sản xuất chip và nhà cung cấp như Micron, AMS Osram và Ferrotec đều đang đầu tư lớn vào Malaysia khi các công ty tìm cách tách chuỗi cung ứng khỏi Trung Quốc (xu hướng được gọi là đa dạng hóa "Trung Quốc +1").
- Vào tháng 8/2024, gã khổng lồ bán dẫn Đức Infineon Technologies AG đã khai trương nhà máy sản xuất silicon carbide công suất 200 mm lớn nhất thế giới tại Kulim, Malaysia, như một phần của kế hoạch mở rộng trị giá 7,7 tỷ USD.
- Riêng Penang đã thu hút được 12,8 tỷ USD vốn đầu tư trực tiếp nước ngoài (FDI) trong năm 2023, nhiều hơn tổng số tiền nhận được từ năm 2013 đến 2020 cộng lại.
- Malaysia đã nổi lên như một trung tâm cho các trung tâm dữ liệu điện toán đám mây và AI, với các cam kết gần đây trị giá 6 tỷ USD từ Amazon Web Services, 4,3 tỷ USD từ Nvidia, 2,2 tỷ USD từ Microsoft, 2,1 tỷ USD từ Bytedance và 2 tỷ USD từ Google.
- Sự trỗi dậy của "chiplet" - các vi xử lý có hiệu suất và nguồn gốc khác nhau được kết hợp thành các chip theo yêu cầu - đã làm tăng tính phức tạp và tầm quan trọng của công việc bán dẫn phía sau.
- Malaysia đang đối mặt với sự cạnh tranh gay gắt từ nhiều quốc gia khác như Ấn Độ, Việt Nam, Thái Lan và Mexico, nhưng vẫn nổi bật với lực lượng lao động kỹ năng cao, cơ sở hạ tầng tốt và hệ sinh thái công nghệ phát triển.
- Chính phủ Malaysia đã công bố Chiến lược bán dẫn quốc gia trị giá 5,3 tỷ USD, bao gồm việc đào tạo 60.000 kỹ sư mới để nâng cao năng lực trong nước. Tuy nhiên, việc thu hút và giữ chân nhân tài vẫn là một thách thức lớn.

📌 Malaysia đang tận dụng xu hướng "friendshoring" để trở thành trung tâm công nghệ toàn cầu, thu hút hơn 70 tỷ USD đầu tư từ các công ty hàng đầu trong những tháng gần đây. Tuy nhiên, quốc gia 35 triệu dân này vẫn phải đối mặt với nhiều thách thức như cạnh tranh nhân tài, phát triển năng lượng xanh và cân bằng quan hệ với cả Mỹ và Trung Quốc. Malaysia đang đẩy mạnh nỗ lực để chuyển từ lắp ráp, thử nghiệm chip sang các hoạt động giá trị gia tăng cao hơn như thiết kế mạch tích hợp và sản xuất tấm wafer.

https://time.com/7015000/ai-semiconductor-chips-malaysia-anwar/

#TIME

Không có file đính kèm.

Nguồn tham khảo

118

AI chips-hardware-compute 2024-08-28 05:36:58

Hot Chips 2024: OpenAI, Intel và Qualcomm thảo luận về tương lai của chip AI và thách thức mở rộng quy mô

• Hội nghị Hot Chips lần thứ 36 đang diễn ra tại Đại học Stanford, thu hút 1.500 người tham dự, với hơn một nửa tham gia trực tuyến.

• Sự kiện nhận được hơn 100 bài nộp từ khắp nơi trên thế giới, cuối cùng chọn 24 bài thuyết trình trong 2 ngày hội nghị.

• Chủ đề chính của hội nghị tập trung vào chip chuyên dụng để xử lý trí tuệ nhân tạo (AI).

• Trevor Cai, Trưởng bộ phận phần cứng của OpenAI, có bài thuyết trình về "Mở rộng quy mô có thể dự đoán và cơ sở hạ tầng".

• Cai cho biết ChatGPT là kết quả của việc OpenAI "dành nhiều năm và hàng tỷ đô la để dự đoán từ tiếp theo tốt hơn", dẫn đến các khả năng như "học tập zero-shot".

• OpenAI dựa vào "luật mở rộng quy mô" cho thấy khả năng có thể tăng lên một cách dự đoán theo "quy luật lũy thừa" của năng lực tính toán được sử dụng.

• Mỗi khi năng lực tính toán tăng gấp đôi, độ chính xác tiến gần đến "entropy không thể giảm".

• Cai nhấn mạnh thách thức trong việc tiếp tục mở rộng quy mô, bao gồm nhu cầu đổi mới thuật toán và chi phí đáng kể cho các cụm máy tính lớn.

• Intel trình bày về chip Lunar Lake mới nhất cho trung tâm dữ liệu, trong khi Qualcomm giới thiệu bộ xử lý Oryon.

• AMD và startup Cerebras Systems sẽ có bài thuyết trình vào ngày thứ Ba của hội nghị.

• Sự kiện thu hút sự quan tâm lớn, với khán phòng chật kín trong các phiên thuyết trình.

• Người tham dự thường mang theo laptop và nhiều màn hình, tạo không gian làm việc cá nhân trong suốt các phiên.

• Hot Chips đã là diễn đàn thảo luận về các chip tiên tiến nhất từ các công ty như Intel, AMD, IBM trong nhiều thập kỷ qua.

📌 Hot Chips 2024 tại Stanford là tâm điểm của ngành công nghiệp chip AI, với sự tham gia của 1.500 người. OpenAI nhấn mạnh tầm quan trọng của việc mở rộng quy mô tính toán, trong khi các công ty như Intel và Qualcomm giới thiệu các thiết kế chip mới nhất cho AI và trung tâm dữ liệu.

https://www.zdnet.com/article/openai-intel-and-qualcomm-talk-ai-compute-at-legendary-hot-chips-conference/

Không có file đính kèm.

Nguồn tham khảo

122

AI market AI chips-hardware-compute 2024-08-27 11:44:27

Các gã khổng lồ công nghệ Trung Quốc đổ tiền tấn vào AI bất chấp lệnh trừng phạt của Mỹ

- Các gã khổng lồ công nghệ Trung Quốc đã tăng gấp đôi chi tiêu vốn trong năm nay, đầu tư mạnh vào hạ tầng AI mặc dù bị Mỹ hạn chế.
- Alibaba, Tencent và Baidu đã chi tổng cộng 50 tỷ nhân dân tệ (7 tỷ USD) trong nửa đầu năm 2024, so với 23 tỷ nhân dân tệ năm trước.
- Các công ty này chủ yếu tập trung vào việc mua vi xử lý và hạ tầng để đào tạo các mô hình ngôn ngữ lớn cho AI.
- ByteDance, công ty mẹ của TikTok, cũng gia tăng chi tiêu cho AI với quỹ tiền mặt hơn 50 tỷ USD và không bị áp lực từ các nhà đầu tư.
- Alibaba đang mua vi xử lý để đào tạo các mô hình AI của mình và cho thuê sức mạnh tính toán cho các bên khác.
- Chi tiêu vốn của Alibaba trong nửa đầu năm đạt 23 tỷ nhân dân tệ, tăng 123% so với năm trước.
- Doanh thu từ mảng điện toán đám mây của Alibaba đã tăng 6% trong quý II so với năm trước, trong khi doanh thu sản phẩm liên quan đến AI đã tăng gấp đôi.
- Alibaba đã đầu tư gần 800 triệu USD vào một công ty khởi nghiệp AI, trong đó một nửa là dưới dạng phiếu mua hàng cho dịch vụ đám mây.
- Mặc dù các biện pháp kiểm soát xuất khẩu của Mỹ đã hạn chế việc tiếp cận các vi xử lý AI hàng đầu như H100, các gã khổng lồ công nghệ Trung Quốc vẫn có thể mua các vi xử lý hiệu suất thấp hơn như H20.
- Dự báo Nvidia sẽ cung cấp hơn 1 triệu vi xử lý H20 cho các công ty công nghệ Trung Quốc trong những tháng tới, với giá từ 12.000 đến 13.000 USD mỗi đơn vị.
- ByteDance được cho là đã mua hàng trăm nghìn vi xử lý H20 cho các trung tâm dữ liệu của mình tại Trung Quốc.
- Tencent cho biết chi tiêu vốn của họ đã tăng lên 23 tỷ nhân dân tệ trong nửa đầu năm, tăng 176% so với năm trước, chủ yếu do đầu tư vào máy chủ GPU và CPU.
- Baidu, mặc dù là công ty AI lâu đời nhất của Trung Quốc, đã chi tiêu vốn khiêm tốn hơn với 4.2 tỷ nhân dân tệ trong nửa đầu năm, tăng 4% so với năm trước.
- Tổng chi tiêu vốn của các công ty công nghệ lớn của Trung Quốc vẫn thấp hơn nhiều so với các đối thủ Mỹ, với Alphabet, Amazon, Meta và Microsoft đã chi 106 tỷ USD trong nửa đầu năm.

📌 Các công ty công nghệ lớn của Trung Quốc đang gia tăng đầu tư vào AI, với chi tiêu vốn đạt 50 tỷ nhân dân tệ trong nửa đầu năm 2024, bất chấp các hạn chế từ Mỹ. Alibaba, Tencent và Baidu dẫn đầu xu hướng này, với ByteDance cũng tham gia mạnh mẽ.

https://www.ft.com/content/31bffc48-2ca7-472b-9d53-3deaad2d86ce

#FT

Không có file đính kèm.

Nguồn tham khảo

154

AI chips-hardware-compute AI an toàn-an ninh-techwar 2024-08-27 11:36:54

Trung Quốc bí mật truy cập từ xa chip Nvidia bị cấm

- Các nhà phát triển AI Trung Quốc đang tìm cách sử dụng chip Nvidia H100 tiên tiến mà không cần đưa chúng vào Trung Quốc.
- Họ hợp tác với các nhà môi giới để truy cập sức mạnh tính toán từ nước ngoài, thường sử dụng các kỹ thuật ẩn danh từ lĩnh vực tiền điện tử.
- Chiến lược này xuất phát từ các quy định xuất khẩu của Mỹ, ngăn cản các công ty Trung Quốc nhập khẩu trực tiếp chip AI từ Nvidia.
- Một doanh nhân tên Derek Aw đã giúp các công ty Trung Quốc vượt qua các rào cản này bằng cách thu hút vốn từ các nhà đầu tư ở Dubai và Mỹ để mua máy chủ AI chứa chip H100.
- Vào tháng 6, công ty của Aw đã đưa hơn 300 máy chủ vào một trung tâm dữ liệu tại Brisbane, Úc, và chỉ 3 tuần sau, các máy chủ này đã bắt đầu xử lý các thuật toán AI cho một công ty tại Bắc Kinh.
- Việc thuê sức mạnh tính toán từ xa không phải là điều mới, nhưng các công ty lớn như Google Cloud và Amazon Web Services có chính sách "Biết Khách Hàng" (KYC) có thể gây khó khăn cho khách hàng Trung Quốc.
- Các nhà môi giới và người mua không vi phạm pháp luật, vì các quy định xuất khẩu không ngăn cản các công ty Trung Quốc truy cập dịch vụ đám mây của Mỹ.
- Một hợp đồng thông minh được sử dụng để đảm bảo tính ẩn danh cao cho các bên tham gia, với các điều khoản được ghi lại trong một sổ cái kỹ thuật số công khai.
- Nhiều công ty AI Trung Quốc thực hiện giao dịch thông qua các công ty con ở Singapore hoặc nơi khác để che giấu danh tính thực sự.
- Các nền tảng GPU phi tập trung đã xuất hiện trong 2 năm qua, cho phép các nhà phát triển AI thuê sức mạnh tính toán từ các máy tính rải rác trên toàn cầu.
- Các dịch vụ này cho phép người dùng truy cập vào chip Nvidia mà không bị ràng buộc bởi các quy định KYC.
- Một số công ty như Edge Matrix Computing đang xây dựng các cụm chip lớn hơn để phục vụ nhu cầu đào tạo AI chuyên sâu.
- Các chip H100 có giá trị tương đương với một chiếc xe Cadillac, làm tăng sức hấp dẫn của chúng trong ngành công nghiệp AI.
- Các nhà lập pháp Mỹ đang lo ngại về việc Trung Quốc lợi dụng các lỗ hổng trong quy định xuất khẩu chip, và chính phủ đang theo dõi các mạng lưới mua sắm bất hợp pháp.

📌 Các nhà phát triển AI Trung Quốc đang sử dụng các phương thức ẩn danh để truy cập chip Nvidia H100 từ nước ngoài, bất chấp các quy định xuất khẩu của Mỹ. Họ hợp tác với các nhà môi giới và sử dụng công nghệ blockchain để đảm bảo tính ẩn danh, với nhu cầu ngày càng tăng cho sức mạnh tính toán này.

https://www.wsj.com/tech/ai/chinas-ai-engineers-are-secretly-accessing-banned-nvidia-chips-58728bf3

#WSJ

Không có file đính kèm.

Nguồn tham khảo

152

AI chips-hardware-compute Semi-Cloud-DC-Green 2024-08-24 10:04:38

Trung Quốc tìm cách tiếp cận chip AI Mỹ qua dịch vụ đám mây

- Các thực thể liên kết với nhà nước Trung Quốc đang sử dụng dịch vụ đám mây của Amazon và các đối thủ để tiếp cận chip AI tiên tiến của Mỹ.
- Chính phủ Mỹ đã hạn chế xuất khẩu các chip AI cao cấp sang Trung Quốc trong 2 năm qua nhằm hạn chế năng lực của quân đội Trung Quốc.
- Việc cung cấp quyền truy cập vào các chip hoặc mô hình AI tiên tiến qua đám mây không vi phạm quy định của Mỹ, vì chỉ có xuất khẩu hoặc chuyển giao hàng hóa, phần mềm hoặc công nghệ mới bị quản lý.
- Một cuộc xem xét của Reuters về hơn 50 tài liệu đấu thầu công khai cho thấy ít nhất 11 thực thể Trung Quốc đã tìm kiếm quyền truy cập vào công nghệ hoặc dịch vụ đám mây bị hạn chế của Mỹ.
- Trong số này, 4 thực thể đã chỉ định rõ Amazon Web Services (AWS) là nhà cung cấp dịch vụ đám mây, mặc dù họ đã truy cập dịch vụ thông qua các công ty trung gian Trung Quốc.
- Tài liệu đấu thầu cho thấy sự đa dạng trong chiến lược mà các thực thể Trung Quốc đang sử dụng để đảm bảo sức mạnh tính toán tiên tiến và quyền truy cập vào các mô hình AI tạo sinh.
- AWS kiểm soát gần 1/3 thị trường hạ tầng đám mây toàn cầu, theo công ty nghiên cứu Canalys.
- Tại Trung Quốc, AWS là nhà cung cấp dịch vụ đám mây lớn thứ 6, theo IDC.
- Đại học Thâm Quyến đã chi 200.000 nhân dân tệ (khoảng 28.027 USD) cho một tài khoản AWS để truy cập vào các máy chủ đám mây sử dụng chip Nvidia A100 và H100 cho một dự án chưa xác định.
- Đại học Thâm Quyến đã nhận dịch vụ qua một trung gian là Công ty TNHH Công nghệ Yunda.
- Xuất khẩu hai chip Nvidia A100 và H100 sang Trung Quốc bị cấm bởi Mỹ.
- Viện nghiên cứu Zhejiang Lab cho biết họ đã dự định chi 184.000 nhân dân tệ để mua dịch vụ điện toán đám mây AWS, vì mô hình AI của họ không thể nhận đủ sức mạnh tính toán từ Alibaba.
- Chính phủ Mỹ đang cố gắng thắt chặt quy định để hạn chế quyền truy cập qua đám mây.
- Chủ tịch Ủy ban Đối ngoại Hạ viện Michael McCaul đã bày tỏ lo ngại về lỗ hổng này và cho rằng cần phải giải quyết sớm.

📌 Các thực thể Trung Quốc đang tìm cách tiếp cận chip AI của Mỹ thông qua dịch vụ đám mây, trong khi chính phủ Mỹ cố gắng thắt chặt quy định để ngăn chặn việc này. AWS là một trong những nhà cung cấp dịch vụ đám mây chính, với nhiều thực thể Trung Quốc sử dụng dịch vụ qua các trung gian.

https://www.taipeitimes.com/News/front/archives/2024/08/24/2003822688

Không có file đính kèm.

Nguồn tham khảo

114

AI chips-hardware-compute 2024-08-24 09:55:40

Không cần chip, AI Trung Quốc vẫn tiến lên mạnh mẽ

- Nhiều công ty khởi nghiệp AI Trung Quốc đang phát triển mã hiệu quả cho các mô hình ngôn ngữ lớn để đối phó với việc thiếu chip tiên tiến.
- Các công ty công nghệ Trung Quốc, bị cắt đứt khỏi các chip AI tiên tiến nhất, đang tìm kiếm cách kiếm tiền mà không cần đến chúng.
- 01.AI, một công ty khởi nghiệp được Alibaba và Xiaomi hỗ trợ, sử dụng định dạng đào tạo độ chính xác thấp để tiết kiệm năng lượng và thời gian.
- Kai-Fu Lee, người sáng lập 01.AI, cho biết việc thiếu GPU đã thúc đẩy sự phát triển hạ tầng AI hiệu quả hơn.
- Tỷ lệ thất bại của cụm chip của 01.AI thấp hơn mức trung bình ngành, cho thấy hiệu quả trong hoạt động.
- Robin Li, CEO của Baidu, cảnh báo về việc lãng phí tài nguyên máy tính khi nhiều công ty phát triển các mô hình nền tảng riêng biệt.
- Một báo cáo từ KPMG cho thấy các nhà đầu tư AI ở Trung Quốc đang tập trung vào việc tạo ra ứng dụng thay vì các mô hình LLM lớn.
- ByteDance, công ty mẹ của TikTok, đã phát triển hơn 20 ứng dụng AI, bao gồm chatbot và ứng dụng tạo video.
- 3 trong số 10 ứng dụng AI được tải xuống nhiều nhất tại Mỹ trong năm nay là của các công ty Trung Quốc.
- Các mô hình nhỏ hơn, được gọi là "edge AI models", có thể là bước đột phá tiếp theo trong ngành AI.
- Baichuan, một công ty unicorn AI, đang hợp tác với Qualcomm để tích hợp mô hình LLM nhỏ hơn vào máy tính AI tại Trung Quốc.
- Huawei đang phát triển chip Ascend được sử dụng bởi nhiều công ty công nghệ lớn và trung tâm dữ liệu AI quốc gia.
- Baidu, Alibaba và Tencent đã sử dụng chip nội bộ để vận hành các mô hình AI của họ, cải thiện kỹ thuật và thuật toán để bù đắp cho việc thiếu hụt sức mạnh tính toán.

📌 Trung Quốc đang phát triển mạnh mẽ trong lĩnh vực AI mà không cần chip tiên tiến, với các công ty như 01.AI và ByteDance dẫn đầu. Xu hướng tập trung vào ứng dụng và mô hình nhỏ cho thấy tiềm năng lớn trong việc tối ưu hóa hiệu suất và tiết kiệm năng lượng.

https://www.wsj.com/tech/ai/chips-or-not-chinese-ai-pushes-ahead-31034e3d

#WSJ

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2024-08-22 14:22:30

Các startup châu Á đang phát triển chip AI giảm chi phí và tiêu thụ năng lượng

- Các công ty khởi nghiệp ở châu Á đang tìm cách phát triển các giải pháp chip AI hiệu quả hơn để cạnh tranh với Nvidia, một gã khổng lồ trong ngành.
- Nvidia hiện đang thống trị thị trường chip AI nhờ vào GPU mạnh mẽ của mình, nhưng các khởi nghiệp tin rằng có thể cung cấp các giải pháp chip tiết kiệm năng lượng hơn.
- Có hai loại chip AI chính: chip "inference" dùng để chạy các mô hình AI hiện có và chip "training" dùng để phát triển các mô hình mới.
- Các công ty như Preferred Networks (PFN) đang phát triển chip cho cả hai loại này, với mục tiêu cải thiện hiệu suất năng lượng.
- Nvidia đã thành công nhờ vào khả năng xử lý song song cao của GPU, nhưng chi phí cao (từ 25.000 đến 40.000 USD cho mỗi chip) đang là một trở ngại lớn.
- PFN và các đối tác của họ đang phát triển chip AI thế hệ tiếp theo, với mục tiêu hoàn thiện vào tháng 3 năm 2027, nhằm tạo ra chip mạnh mẽ hơn và tiết kiệm năng lượng hơn.
- Các công ty khởi nghiệp như Edgecortix cũng đang tìm cách phát triển chip AI hiệu quả hơn, giảm thiểu việc truy cập bộ nhớ để tiết kiệm năng lượng.
- Dự báo rằng vào năm 2025-2026, sẽ có nhiều đối thủ mới tham gia thị trường chip AI, cạnh tranh với Nvidia.
- Nvidia vẫn chiếm khoảng 30-40% thị trường chip AI, nhưng các khởi nghiệp đang tìm kiếm các ngách thị trường riêng để phát triển.
- Thị trường tiềm năng cho chip AI bao gồm máy tính cá nhân, smartphone, camera giám sát và drone.
- Các công ty lớn như Google, Meta và Amazon cũng đang tham gia vào cuộc đua chip AI, làm tăng sức ép cạnh tranh lên Nvidia.
- Nhu cầu về AI trên thiết bị đang gia tăng, tạo cơ hội cho các công ty khởi nghiệp phát triển chip AI tiết kiệm năng lượng hơn.
- Các công ty khởi nghiệp tin rằng họ có thể cung cấp các giải pháp chip tốt hơn cho các ứng dụng cụ thể, trong khi Nvidia vẫn tập trung vào các chip đa năng.

📌 Nhu cầu về chip AI tiết kiệm năng lượng đang tăng cao, với các công ty khởi nghiệp châu Á như PFN và Edgecortix nỗ lực phát triển các giải pháp cạnh tranh với Nvidia. Dự báo rằng vào năm 2025-2026, thị trường chip sẽ có nhiều thay đổi lớn khi các đối thủ mới xuất hiện.

https://asia.nikkei.com/Business/Business-Spotlight/Nvidia-vs.-the-startups-AI-chip-challengers-chase-efficiency

Không có file đính kèm.

Nguồn tham khảo

AI viễn thông AI chips-hardware-compute 2024-08-21 17:14:38

SK Telecom sẽ mở trung tâm dữ liệu AI cung cấp dịch vụ GPU-as-a-service tại Hàn Quốc

- SK Telecom sẽ khai trương một trung tâm dữ liệu AI tại Seoul vào tháng 12 năm 2024, sử dụng GPU của Nvidia trong khuôn khổ hợp tác với Lambda, một công ty GPU đám mây của Mỹ.
- Hợp tác này nhằm mở rộng dịch vụ GPU-as-a-service (GPUaaS) tại Hàn Quốc, giúp các doanh nghiệp dễ dàng thuê tài nguyên GPU qua đám mây thay vì phải đầu tư vào chip đắt tiền.
- Lambda, được thành lập vào năm 2012, chuyên cung cấp dịch vụ GPUaaS với các bộ xử lý mới nhất từ Nvidia, đang ngày càng trở nên phổ biến trong bối cảnh giá GPU cao và nguồn cung hạn chế.
- Dự kiến, SK Telecom và Lambda sẽ triển khai bộ xử lý Nvidia H100 tại trung tâm dữ liệu của SK Broadband ở quận Geumcheon, Seoul, và sẽ lắp đặt hàng ngàn GPU, bao gồm cả bộ xử lý H200 mới nhất trong 3 năm tới.
- Mục tiêu của SK Telecom là thiết lập trang trại GPU lớn nhất Hàn Quốc, hoàn toàn sử dụng GPU của Nvidia, từ đó nâng cao khả năng cạnh tranh trong lĩnh vực AI của quốc gia.
- Trung tâm dữ liệu này cũng sẽ là cơ sở khu vực của Lambda tại Hàn Quốc, đảm bảo dữ liệu của các công ty trong nước sẽ được lưu trữ tại đây.
- SK Telecom sẽ ra mắt dịch vụ GPUaaS theo hình thức đăng ký vào tháng 12, nhằm tận dụng sự tăng trưởng mạnh mẽ của thị trường GPUaaS toàn cầu.
- Theo dự báo của Fortune Business Insights, thị trường GPUaaS toàn cầu sẽ tăng trưởng từ 4.31 tỷ USD năm 2024 lên 49.84 tỷ USD vào năm 2032, với tỷ lệ tăng trưởng hàng năm đạt 35.8%.
- Giám đốc điều hành Lambda, Stephen Balaban, nhấn mạnh tầm nhìn chung của 2 công ty là biến tài nguyên tính toán GPU trở nên dễ dàng như điện, đồng thời bày tỏ sự hào hứng trong việc hợp tác với SK Telecom để phát triển lĩnh vực AI cloud tại Hàn Quốc.
- Một quan chức SK Telecom cho biết việc đảm bảo nguồn cung GPU ổn định thông qua quan hệ đối tác chiến lược với Lambda là rất quan trọng để mở rộng nguồn cung GPU tại Hàn Quốc.

📌 SK Telecom sẽ mở trung tâm dữ liệu AI lớn nhất Hàn Quốc vào tháng 12 với hàng ngàn GPU Nvidia, góp phần vào sự phát triển của thị trường GPU-as-a-service, dự kiến đạt 49.84 tỷ USD vào năm 2032.

https://www.koreatimes.co.kr/www/tech/2024/08/133_380962.html

Không có file đính kèm.

Nguồn tham khảo

135

AI chips-hardware-compute Semi-Cloud-DC-Green 2024-08-21 00:38:41

FPT Việt Nam đầu tư 200 triệu USD vào dịch vụ AI tại Nhật Bản

• FPT, tập đoàn công nghệ hàng đầu Việt Nam, đang mở rộng hoạt động tại Nhật Bản với khoản đầu tư 200 triệu USD để khởi động dịch vụ điện toán đám mây cho các doanh nghiệp AI và dịch vụ giải pháp chuyển đổi số cho các công ty Nhật Bản vào đầu năm sau.

• Pham Minh Tuan, CEO của FPT Software, cho biết công ty sẽ cung cấp cả nguồn nhân lực và cơ sở hạ tầng tính toán GPU để tạo ra các giải pháp AI tiên tiến cho thị trường Nhật Bản.

• FPT đã công bố hợp tác chiến lược toàn diện với Nvidia vào tháng 4 để xây dựng nhà máy AI tại Việt Nam và hợp tác trên quy mô toàn cầu.

• Dịch vụ mới sẽ được ra mắt vào tháng 1 hoặc tháng 2 năm sau, với việc triển khai phần cứng và vận hành trung tâm dữ liệu vào tháng 12 năm nay.

• Khoản đầu tư 200 triệu USD sẽ được giải ngân vào cuối năm nay. FPT cũng sẽ mở rộng lực lượng lao động tại Nhật Bản từ 3.500 lên 5.000 người vào năm tới.

• Mục tiêu chính của dịch vụ AI là chuyển đổi số cho các tổ chức tài chính tại Nhật Bản, tận dụng dữ liệu lớn và công nghệ AI tiên tiến.

• FPT Japan vừa mở văn phòng mới tại tòa nhà 42 tầng ở Mita, Tokyo, chiếm toàn bộ tầng 33 với tầm nhìn toàn cảnh Tokyo.

• Tính đến tháng 3, FPT Japan có 3.500 nhân viên và dự kiến sẽ đạt 5.000 người vào năm sau. 63% nhân viên là người Việt Nam và 31% là người Nhật.

• Doanh thu năm 2023 của FPT Corp đạt 52.618 tỷ đồng (2,1 tỷ USD), tăng 19,6% so với năm trước. Lợi nhuận sau thuế đạt 7.788 tỷ đồng, tăng 20,0%.

• FPT đã mở rộng kinh doanh quốc tế nhanh chóng, vượt mốc 1 tỷ USD doanh thu hàng năm từ dịch vụ IT cho thị trường nước ngoài lần đầu tiên vào năm ngoái.

• Nhật Bản chiếm 38% tổng doanh thu của mảng phần mềm FPT trong năm 2023. Công ty có nhiều khách hàng lớn tại Nhật như KDDI, Itochu Corp., Panasonic ITS, Takenaka Corp., Fuji Film Healthcare và Microsoft Japan.

• FPT nhấn mạnh khả năng ngôn ngữ để làm việc với các công ty Nhật Bản. Hơn một nửa số nhân viên Việt Nam đã sống tại Nhật trước khi gia nhập FPT.

• Thách thức của FPT là nhận diện thương hiệu thấp trong tuyển dụng và thu hút khách hàng mới tại Nhật Bản. Công ty đang nỗ lực duy trì 30-40% nhân viên không phải người Việt tại Nhật.

📌 FPT đầu tư 200 triệu USD vào dịch vụ AI tại Nhật, mở rộng nhân sự lên 5.000 người vào 2025. Công ty hợp tác với Nvidia, tập trung vào chuyển đổi số ngành tài chính. Doanh thu IT nước ngoài vượt 1 tỷ USD, Nhật chiếm 38% doanh thu phần mềm 2023.

https://asia.nikkei.com/Business/Technology/Vietnam-s-FPT-invests-200m-to-launch-AI-services-in-Japan

Không có file đính kèm.

Nguồn tham khảo

114

AI chips-hardware-compute 2024-08-19 20:54:27

AMD đã ký thỏa thuận 4,9 tỷ USD thách thức Nvidia trong lĩnh vực hạ tầng AI

- AMD đã đồng ý mua lại ZT Systems, một nhóm hạ tầng AI, với giá 4,9 tỷ USD bằng tiền mặt và cổ phiếu, nhằm gia tăng sức cạnh tranh với Nvidia.
- Thỏa thuận này sẽ giúp AMD tăng tốc độ áp dụng dòng chip AI Instinct của mình, đối thủ của các GPU phổ biến của Nvidia.
- ZT Systems là một công ty tư nhân, được thành lập cách đây ba thập kỷ, chuyên xây dựng hạ tầng máy tính tùy chỉnh cho các "hyperscaler" AI lớn nhất như Microsoft, Meta và Amazon.
- Đây là thương vụ mua lại lớn nhất của AMD kể từ khi họ mua Xilinx với giá 35 tỷ USD vào năm 2022.
- CEO Lisa Su của AMD cho biết việc mua lại sẽ mang đến 1.000 kỹ sư thiết kế hàng đầu cho đội ngũ của họ, giúp phát triển chip và hệ thống song song.
- Thương vụ dự kiến sẽ hoàn tất trong nửa đầu năm 2025, phụ thuộc vào sự phê duyệt của cơ quan quản lý.
- Giá trị 4,9 tỷ USD bao gồm tối đa 400 triệu USD phụ thuộc vào "một số cột mốc sau khi hoàn tất".
- AMD đang tìm cách phá vỡ sự thống trị của Nvidia trên thị trường chip trung tâm dữ liệu AI, nơi Nvidia đã trở thành công ty có giá trị nhất thế giới vào đầu năm nay.
- Nvidia thành công nhờ vào cách tiếp cận "hệ thống", cung cấp hạ tầng máy tính toàn diện bao gồm các giá máy chủ, thiết bị mạng và công cụ phần mềm.
- Thương vụ mua lại ZT Systems cho thấy AMD đang xây dựng hệ thống hạ tầng riêng của mình.
- AMD đã ra mắt dòng chip AI MI300 vào năm ngoái và dự kiến sẽ phát hành chip MI350 thế hệ tiếp theo vào năm sau.
- Microsoft là một trong những khách hàng đầu tiên áp dụng MI300 vào nền tảng đám mây Azure để chạy các mô hình AI như GPT-4 của OpenAI.
- Doanh thu hàng quý của AMD từ chip đã vượt qua 1 tỷ USD lần đầu tiên trong ba tháng kết thúc vào ngày 30 tháng 6.
- Dù MI300 được quảng bá là sản phẩm nhanh nhất của AMD, doanh thu trung tâm dữ liệu của họ vẫn chỉ là một phần nhỏ so với 22,6 tỷ USD mà Nvidia thu về trong quý kết thúc vào tháng 4.
- ZT Systems đã công bố hợp tác với Nvidia vào tháng 3 để xây dựng hạ tầng AI tùy chỉnh sử dụng chip Blackwell của Nvidia.
- Lisa Su cho biết họ sẽ tôn trọng các cam kết với khách hàng hiện tại trong khi thúc đẩy giải pháp AI của AMD.
- AMD đã đầu tư hơn 1 tỷ USD trong năm qua để mở rộng hệ sinh thái phần cứng và phần mềm AI của mình.
- Vào tháng 7, công ty đã thông báo mua lại start-up AI Silo AI của Phần Lan với giá 665 triệu USD, thương vụ lớn nhất trong một thập kỷ đối với một start-up AI tư nhân tại châu Âu.

📌 AMD đã ký thỏa thuận mua lại ZT Systems với giá 4,9 tỷ USD để tăng cường khả năng cạnh tranh trong lĩnh vực chip AI, với mục tiêu đẩy nhanh việc áp dụng công nghệ AI, đồng thời mở rộng đội ngũ kỹ sư và đầu tư hơn 1 tỷ USD vào hệ sinh thái AI.

https://www.ft.com/content/f00c0e11-b0dd-419a-a11a-f2cc586bba08

#FT

Không có file đính kèm.

Nguồn tham khảo

113

AI viễn thông AI chips-hardware-compute 2024-08-19 20:46:17

Singtel hợp tác với Bridge Alliance cung cấp GPU-as-a-Service tại Đông Nam Á

- Singtel đã công bố hợp tác với Bridge Alliance vào ngày 19 tháng 8 năm 2024 để cung cấp dịch vụ GPU-as-a-Service (GPUaaS) cho các doanh nghiệp tại Đông Nam Á.
- GPUaaS là giải pháp dựa trên đám mây, cho phép truy cập vào các đơn vị xử lý đồ họa (GPU) theo yêu cầu.
- GPU là loại chip AI, có ứng dụng trong học máy, xử lý đồ họa, xử lý dữ liệu và game.
- Các nhà mạng thành viên của Bridge Alliance, bao gồm AIS tại Thái Lan, Maxis tại Malaysia và Telkomsel tại Indonesia, là những người đầu tiên áp dụng dịch vụ này.
- Bill Chang, CEO của đơn vị Digital InfraCo của Singtel, cho biết sự hợp tác này sẽ giúp doanh nghiệp trong khu vực tiếp cận công nghệ AI dễ dàng hơn, nâng cao năng suất và giá trị kinh doanh.
- Maxis mong muốn trở thành nhà mạng đầu tiên cung cấp GPUaaS tại Malaysia, giúp doanh nghiệp tiết kiệm chi phí và linh hoạt hơn trong việc mở rộng tài nguyên.
- Dịch vụ GPUaaS dự kiến sẽ được ra mắt vào quý 3 năm 2024 tại Singapore và Đông Nam Á, sử dụng các cụm GPU Nvidia H100 được vận hành tại các trung tâm dữ liệu nâng cấp của Singtel.
- Sự phát triển của GPUaaS nhằm đáp ứng nhu cầu ngày càng tăng về khả năng xử lý dữ liệu và tính toán hiệu suất cao trong các ngành công nghiệp khác nhau.
- Sự hợp tác này không chỉ mang lại lợi ích cho các doanh nghiệp mà còn thúc đẩy sự phát triển công nghệ tại khu vực Đông Nam Á.

📌 Singtel và Bridge Alliance hợp tác cung cấp GPU-as-a-Service, mở ra cơ hội cho các doanh nghiệp tại Đông Nam Á tiếp cận công nghệ AI tiên tiến. Dịch vụ dự kiến ra mắt vào quý 3 năm 2024 với sự hỗ trợ từ các nhà mạng như AIS, Maxis và Telkomsel.

https://www.thehindu.com/news/national/tech-firms-reiterate-opposition-to-telcos-demand-of-ott-licensing/article68542191.ece

1. Hợp tác giữa Singtel và NVIDIA:
- Singtel đã tham gia Chương trình Đối tác Đám mây của NVIDIA và sẽ cung cấp nền tảng AI toàn diện của NVIDIA cho các doanh nghiệp tại Singapore và khu vực Đông Nam Á.

2. Dữ liệu trung tâm AI bền vững:
- Dịch vụ AI của Singtel sẽ được lưu trữ tại trung tâm dữ liệu khu vực Nxera, nơi phát triển các trung tâm dữ liệu AI bền vững và kết nối cao.

3. Tuyên bố của CEO Singtel:
- Bill Chang, CEO của Nxera, nhấn mạnh rằng hợp tác này sẽ giúp các doanh nghiệp, khởi nghiệp, cơ quan chính phủ và tổ chức nghiên cứu tiếp cận công nghệ AI một cách bền vững.

4. Hỗ trợ phát triển AI:
- Hợp tác này sẽ tạo điều kiện cho các doanh nghiệp và khách hàng trong khu vực phát triển AI mạnh mẽ hơn, bao gồm các mô hình ngôn ngữ lớn và tinh chỉnh AI.

5. Trung tâm dữ liệu DC Tuas:
- Trung tâm dữ liệu xanh DC Tuas với công suất 58MW sẽ là một trong những trung tâm dữ liệu đầu tiên sẵn sàng cho AI khi đi vào hoạt động vào đầu năm 2026.

6. Hiệu suất năng lượng:
- DC Tuas sẽ hoạt động với hiệu quả sử dụng năng lượng (PUE) là 1,23, trở thành một trong những trung tâm dữ liệu hiệu quả nhất trong ngành.

7. Dự án trung tâm dữ liệu khác:
- Singtel cũng đang phát triển 2 dự án trung tâm dữ liệu hiện đại khác tại Indonesia và Thái Lan.

8. Kinh nghiệm của Singtel:
- Singtel đã có kinh nghiệm cung cấp dịch vụ đám mây biên với AI của NVIDIA từ năm 2021 tại thử nghiệm 5G@Sentosa.

9. Nền tảng Paragon:
- Nền tảng Paragon của Singtel sẽ giúp khách hàng quản lý và triển khai các mạng lưới, AI và khối lượng công việc đám mây một cách hiệu quả và tiết kiệm chi phí hơn.

10. Chiến lược AI quốc gia của Singapore:
- Hợp tác này hỗ trợ chiến lược AI quốc gia của Singapore nhằm thúc đẩy phát triển kinh tế thông qua công nghệ mới và nâng cao cơ sở hạ tầng tính toán cũng như nguồn nhân lực AI chuyên môn.

https://www.singtel.com/about-us/media-centre/news-releases/singtel-collaborates-with-nvidia-to-bring-ai-to-singapore-and-so

Không có file đính kèm.

Nguồn tham khảo

119

AI chips-hardware-compute 2024-08-19 16:12:26

Chỉ 25% GPU của Yotta được sử dụng bởi các công ty Ấn Độ

- Yotta Data Services đã đặt hàng 16.384 GPU H100 vào tháng 11 năm ngoái, trong đó khoảng 4.096 chip đã được triển khai và nghiệm thu cho khách hàng tại Ấn Độ và các thị trường quốc tế.
- Hiện tại, chỉ có khoảng 25% GPU của Yotta được sử dụng bởi các công ty Ấn Độ, trong khi 75% còn lại (tương đương khoảng 3.000 GPU) chủ yếu phục vụ cho các nhà khai thác nước ngoài. Điều này cho thấy sự phát triển mạnh mẽ của hệ sinh thái AI ở các quốc gia khác, đặc biệt là ở phương Tây, nơi nhu cầu về các mô hình ngôn ngữ lớn đang gia tăng.
- CEO Sunil Gupta nhấn mạnh rằng hệ sinh thái AI tại Ấn Độ vẫn đang trong quá trình phát triển và chưa đạt đến mức độ như ở các nước phương Tây. Do đó, việc sử dụng GPU tại Ấn Độ vẫn còn hạn chế.
- Yotta Data Services không có kế hoạch giảm giá cho chính phủ Ấn Độ, mặc dù chính phủ đang cố gắng tạo điều kiện cho các công ty khởi nghiệp, nhà nghiên cứu và giới học thuật tiếp cận với 10.000 GPU-time.
- Mức giá cho thời gian sử dụng GPU của Yotta là $3 một giờ, trong khi ở Mỹ là $10 một giờ. Điều này giúp dịch vụ của Yotta trở nên dễ tiếp cận hơn cho nhiều đối tượng, đặc biệt là các công ty khởi nghiệp và nhà nghiên cứu.
- Chip H100 mà Yotta cung cấp là thế hệ mới nhất và hiện không có nhà cung cấp dịch vụ điện toán đám mây nào khác ở Ấn Độ có khả năng cung cấp loại chip này.

📌 Yotta Data Services đang cung cấp thời gian GPU với giá $3 một giờ, rẻ hơn nhiều so với mức $10 một giờ ở Mỹ, nhờ đó dễ tiếp cận hơn với mọi người. Công ty cũng đã đặt hàng thêm 8.000 GPU H100 mới để triển khai trong 3 tháng tới, nhằm đáp ứng nhu cầu ngày càng tăng của thị trường.

https://economictimes.indiatimes.com/tech/technology/only-25-of-yottas-gpus-used-by-indian-firms-ceo-sunil-gupta/articleshow/112609924.cms

Không có file đính kèm.

Nguồn tham khảo

122

AI chips-hardware-compute AI doanh nghiệp 2024-08-18 07:52:43

Các chiến lược tiết kiệm chi phí trong việc huấn luyện mô hình AI cho doanh nghiệp nhỏ

• Huấn luyện mô hình AI đòi hỏi chi phí khổng lồ, chủ yếu do phần cứng đắt đỏ như GPU. Ví dụ, việc huấn luyện LLaMA 2 70B cần ít nhất 10^24 phép tính dấu phẩy động.

• Các công ty lớn như Microsoft, Meta, Nvidia đang phát triển chip AI tùy chỉnh để tối ưu hóa phần cứng. Tuy nhiên, cách tiếp cận này chỉ phù hợp với các "đại gia" có nguồn lực tài chính dồi dào.

• Đối với doanh nghiệp nhỏ và startup, các giải pháp phần mềm sáng tạo là lựa chọn khả thi hơn để tối ưu hóa quá trình huấn luyện và giảm chi phí.

• Mixed precision training kết hợp các phép toán độ chính xác thấp b/float16 với float32 tiêu chuẩn, giúp cải thiện tốc độ xử lý và sử dụng bộ nhớ. Kỹ thuật này có thể cải thiện thời gian chạy lên đến 6 lần trên GPU và 2-3 lần trên TPU.

• Activation checkpointing lưu trữ một tập con các giá trị thiết yếu và chỉ tính toán lại phần còn lại khi cần thiết. Phương pháp này có thể giảm sử dụng bộ nhớ tới 70%, mặc dù kéo dài thời gian huấn luyện 15-25%.

• Multi-GPU training phân phối quá trình huấn luyện trên nhiều GPU cùng lúc. Các công cụ như DeepSpeed, FSDP và YaFSDP có thể tăng tốc độ huấn luyện lên đến 10 lần so với phương pháp truyền thống.

• Các framework mã nguồn mở như Nvidia's APEX và PyTorch của Meta AI hỗ trợ nhiều kỹ thuật tối ưu hóa, giúp việc tích hợp vào quy trình huấn luyện trở nên dễ dàng hơn.

• Bằng cách áp dụng các chiến lược này, ngay cả các doanh nghiệp có nguồn lực hạn chế cũng có thể tham gia vào lĩnh vực AI mà không cần đầu tư lớn vào phần cứng đắt đỏ.

📌 Các kỹ thuật phần mềm như mixed precision training, activation checkpointing và multi-GPU training giúp doanh nghiệp nhỏ tiết kiệm chi phí huấn luyện AI đến 70%. Những công cụ này tăng hiệu quả tính toán, giảm thời gian chạy và cho phép huấn luyện mô hình lớn hơn trên phần cứng hiện có.

https://venturebeat.com/ai/the-economics-of-gpus-how-to-train-your-ai-model-without-going-broke/

Không có file đính kèm.

Nguồn tham khảo

121

Semi-Cloud-DC-Green AI chips-hardware-compute 2024-08-18 01:05:56

IMF đề xuất tăng thuế điện đối với thợ đào tiền mã hóa và trung tâm dữ liệu AI nhằm giảm phát thải carbon toàn cầu

• IMF đề xuất tăng thuế điện đối với thợ đào tiền mã hóa lên tới 85% để giảm phát thải carbon toàn cầu và tăng nguồn thu ngân sách.

• Biện pháp này có thể mang lại 5,2 tỷ USD doanh thu hàng năm cho chính phủ và giảm 100 triệu tấn khí thải, tương đương lượng phát thải hiện tại của Bỉ.

• Đối với trung tâm dữ liệu AI, IMF đề xuất mức thuế 0,032 USD/kWh, hoặc 0,052 USD/kWh nếu tính cả chi phí ô nhiễm không khí. Điều này có thể mang lại tới 18 tỷ USD doanh thu hàng năm.

• IMF ước tính hoạt động khai thác tiền mã hóa và trung tâm dữ liệu AI chiếm 2% lượng điện tiêu thụ toàn cầu và gần 1% lượng phát thải carbon toàn cầu.

• Dự kiến trong 3 năm tới, hai ngành này sẽ tiêu thụ lượng điện tương đương Nhật Bản - quốc gia đứng thứ 5 thế giới về sử dụng điện.

• IMF dự báo riêng hoạt động khai thác tiền mã hóa có thể đóng góp 0,7% lượng phát thải CO2 toàn cầu vào năm 2027.

• Mức thuế trực tiếp 0,047 USD/kWh đối với điện sử dụng cho khai thác tiền mã hóa có thể giúp giảm đáng kể lượng phát thải, phù hợp với mục tiêu khí hậu toàn cầu.

• Mức thuế này có thể tăng lên 0,089 USD/kWh nếu tính cả tác động sức khỏe rộng hơn của ô nhiễm không khí, tương đương mức tăng 85% chi phí điện cho thợ đào.

• IMF thừa nhận việc tăng thuế cần được thực hiện trên phạm vi toàn cầu để ngăn chặn tình trạng thợ đào di chuyển sang các khu vực khác có chính sách thuế thấp hơn.

• Đề xuất này được đưa ra bất chấp thực tế các hoạt động khai thác nhỏ lẻ đang gặp khó khăn trong việc tạo ra lợi nhuận sau sự kiện halving Bitcoin vào tháng 4/2024.

• Chưa rõ liệu việc tăng thuế có trực tiếp làm giảm lượng phát thải hay không, vì thợ đào thường tìm kiếm các giải pháp rẻ hơn ở những quốc gia có chi phí điện thuận lợi hơn.

📌 IMF đề xuất tăng thuế điện lên tới 85% đối với thợ đào tiền mã hóa và trung tâm dữ liệu AI nhằm giảm phát thải carbon toàn cầu. Biện pháp này có thể mang lại 23,2 tỷ USD doanh thu hàng năm và giảm 100 triệu tấn khí thải, nhưng cần được thực hiện đồng bộ trên toàn cầu để đạt hiệu quả.

https://decrypt.co/245032/imf-calls-for-increased-electricity-taxes-on-crypto-miners-ai-data-centers

Không có file đính kèm.

Nguồn tham khảo

131

AI chips-hardware-compute 2024-08-18 01:02:30

Ola Electric công bố 3 chip AI đầu tiên của Ấn Độ hiệu suất cao, tiết kiệm năng lượng, cạnh tranh Nvidia

• Ola Electric, nhà sản xuất xe điện hai bánh lớn nhất Ấn Độ, vừa công bố kế hoạch phát triển các chip AI đầu tiên của nước này.

• Ba chip đầu tiên dự kiến ra mắt vào năm 2026 bao gồm: Bodhi 1, Ojas và Sarv 1. Chip thứ tư là Bodhi 2 sẽ được giới thiệu vào năm 2028.

• Bodhi 1 được thiết kế cho suy luận AI, phù hợp với các mô hình ngôn ngữ lớn và mô hình thị giác. Ola tuyên bố Bodhi 1 cung cấp hiệu suất năng lượng tốt nhất trong phân khúc.

• Ojas là chip AI Edge có thể tùy chỉnh cho nhiều ứng dụng khác nhau như ô tô, di động, IoT. Ola dự định triển khai chip này trong xe điện thế hệ tiếp theo để vận hành các hệ thống sạc, ADAS.

• Sarv 1 sử dụng bộ lệnh Arm được xây dựng cho các trung tâm dữ liệu, nhắm đến nhu cầu tính toán AI ngày càng tăng.

• Theo trình bày của Ola, các chip nguyên mẫu của họ mang lại hiệu suất và hiệu quả năng lượng tốt hơn so với GPU của Nvidia. Tuy nhiên, công ty chưa cung cấp thông tin cụ thể về việc so sánh với GPU nào của Nvidia.

• Ola cũng chưa tiết lộ nơi sản xuất các chip này.

• Động thái này cho thấy Ấn Độ muốn tham gia vào cuộc đua AI toàn cầu, hiện đang bị Mỹ và Trung Quốc thống trị.

• Với dân số đông nhất thế giới, Ấn Độ có nguồn nhân lực công nghệ dồi dào để thúc đẩy công nghệ AI.

• Nhiều công ty như Nvidia và ASML bị cấm bán công nghệ tiên tiến cho Trung Quốc có thể sẽ vui mừng mở rộng thị trường sang Ấn Độ.

• Yotta, công ty trung tâm dữ liệu và máy chủ của Ấn Độ, đã đặt hàng 16.000 GPU Nvidia dự kiến giao vào năm tới, cùng với 16.000 GPU đã được giao vào tháng trước.

📌 Ola Electric công bố 4 chip AI đầu tiên của Ấn Độ, dự kiến ra mắt 2026-2028. Các chip hứa hẹn hiệu suất cao, tiết kiệm năng lượng, cạnh tranh trực tiếp với Nvidia. Động thái này đánh dấu bước đi quan trọng của Ấn Độ trong cuộc đua AI toàn cầu.

https://www.tomshardware.com/tech-industry/artificial-intelligence/ola-electric-announces-indias-first-ai-chip-bodhi-1-ojas-and-sarv-1-slated-for-2026-and-bodhi-2-for-2028

Không có file đính kèm.

Nguồn tham khảo

141

AI benchmark AI chips-hardware-compute 2024-08-17 08:57:19

Geekbench AI 1.0 ra mắt: công cụ đánh giá toàn diện hiệu năng AI cho CPU, GPU và NPU

• Primate Labs vừa ra mắt Geekbench AI phiên bản 1.0, một công cụ benchmark mới để đánh giá hiệu năng xử lý AI của CPU, GPU và NPU.

• Geekbench AI là phiên bản nâng cấp từ dự án thử nghiệm Geekbench ML, được đổi tên nhằm tận dụng xu hướng AI đang phát triển mạnh mẽ.

• Công cụ này đo lường cả tốc độ và độ chính xác của các tác vụ AI, phù hợp với nhu cầu đánh giá hiệu năng xử lý AI cục bộ ngày càng tăng.

• Geekbench AI hỗ trợ nhiều framework AI khác nhau như OpenVINO, ONNX, QNN, CoreML và các framework riêng của các nhà sản xuất.

• Benchmark có thể chạy trên CPU, GPU hoặc NPU (nếu thiết bị tương thích). Trên Windows, hiện mới hỗ trợ NPU của Intel và Qualcomm, chưa hỗ trợ AMD.

• Công cụ này có sẵn cho Windows, macOS, Linux, iOS/iPadOS và Android. Phiên bản miễn phí đã đủ dùng, bản Pro có thêm một số tính năng nâng cao.

• Geekbench AI đánh giá hiệu năng với nhiều mức độ chính xác khác nhau: single-precision, half-precision và quantized data.

• Primate Labs cam kết sẽ cập nhật thường xuyên để hỗ trợ phần cứng, framework và workload mới khi thị trường AI phát triển.

• Việc ra mắt Geekbench AI đáp ứng nhu cầu đo lường hiệu năng NPU, khi các chip của Intel và AMD đã tích hợp NPU tiêu chuẩn.

• Xu hướng xử lý AI cục bộ trên thiết bị thay vì trên đám mây đang gia tăng, đòi hỏi các công cụ benchmark phù hợp.

• Microsoft cũng đang thúc đẩy sáng kiến Copilot+, trong khi Intel, AMD, Qualcomm và Apple đều nỗ lực cải thiện hiệu năng NPU.

📌 Geekbench AI 1.0 ra mắt như một công cụ benchmark toàn diện cho hiệu năng xử lý AI, hỗ trợ đa nền tảng và framework. Đáp ứng nhu cầu đánh giá NPU ngày càng phổ biến, Primate Labs cam kết cập nhật liên tục để theo kịp sự phát triển nhanh chóng của công nghệ AI.

https://arstechnica.com/gadgets/2024/08/geekbench-ml-becomes-geekbench-ai-a-cross-platform-performance-test-for-npus-and-more/

Không có file đính kèm.

Nguồn tham khảo

139

AI chips-hardware-compute AI viễn thông 2024-08-16 14:49:36

SoftBank thảo luận hợp tác chip AI với Intel để cạnh tranh với Nvidia

- SoftBank đã thảo luận về việc hợp tác sản xuất chip trí tuệ nhân tạo (AI) với Intel để cạnh tranh với Nvidia, nhằm đẩy nhanh nỗ lực của mình trong việc kết hợp thiết kế chip của Arm (công ty con) với chuyên môn sản xuất của Graphcore (công ty mới mua lại).

- Kế hoạch này do Masayoshi Son, CEO của SoftBank, đề xuất với mục tiêu đầu tư hàng tỷ USD để đưa tập đoàn Nhật Bản vào trung tâm của cơn sốt AI bằng cách tạo ra đối thủ cạnh tranh với chip AI hàng đầu của Nvidia.

- Tuy nhiên, các cuộc đàm phán với Intel đã thất bại trong những tháng gần đây, trước khi Intel công bố kế hoạch cắt giảm chi phí và sa thải hàng nghìn nhân viên vào đầu tháng 8. SoftBank hiện đang tập trung vào các cuộc thảo luận với TSMC, nhà sản xuất chip theo hợp đồng lớn nhất thế giới.

- Việc sử dụng nhà máy của Intel ở Mỹ để sản xuất chip AI có thể đã cho phép SoftBank tiếp cận nguồn tài trợ từ Đạo luật Chip của chính phủ Biden nhằm thúc đẩy sản xuất bán dẫn trong nước.

- SoftBank đổ lỗi cho Intel về việc đàm phán sụp đổ, cho rằng nhà sản xuất chip này không thể đáp ứng yêu cầu về khối lượng và tốc độ. Tuy nhiên, các cuộc đàm phán vẫn có thể khởi động lại do số lượng nhà sản xuất chip có khả năng sản xuất chip AI hiện đại là hạn chế.

- Mặc dù gặp nhiều bất định xung quanh kế hoạch sản xuất, Son vẫn chào mời một số tập đoàn công nghệ lớn nhất thế giới, bao gồm Google và Meta, để tìm kiếm sự ủng hộ và tài trợ cho dự án mới nhất của mình.

📌SoftBank đang nỗ lực trở thành trung tâm của cơn sốt AI bằng cách tạo ra đối thủ cạnh tranh với chip AI của Nvidia, thông qua việc kết hợp thiết kế chip của Arm và chuyên môn sản xuất của Graphcore. Tuy nhiên, họ gặp khó khăn trong việc tìm đối tác sản xuất phù hợp và cần hàng tỷ USD để thực hiện kế hoạch tham vọng này.

https://www.ft.com/content/6b7fd8a1-7f9c-427b-8467-f911f5f0d520

#FT

Không có file đính kèm.

Nguồn tham khảo

109

AI chips-hardware-compute 2024-08-15 07:40:10

Các công ty khởi nghiệp AI Trung Quốc chuyển sang RTX 4090 vì H20 quá đắt

- Nhiều công ty khởi nghiệp AI ở Trung Quốc đang ưa chuộng sử dụng RTX 4090, một trong những card đồ họa tốt nhất, thay vì GPU AI H20 tuân thủ lệnh trừng phạt của Nvidia.
- GPU H20 tuân thủ lệnh trừng phạt của Nvidia quá đắt đỏ đối với nhiều công ty vừa và nhỏ, chủ yếu là vì nó không mang lại mức hiệu suất như GPU A100 và H100 gốc.
- Một máy chủ 8 card H20 có giá khoảng 1,3 triệu nhân dân tệ (khoảng 180.000 USD). Trong khi đó, một RTX 4090 có giá từ 16.000 đến 20.000 nhân dân tệ (khoảng 2.200 đến 2.800 USD). Thậm chí nếu tính mỗi GPU RTX 4090 là 20.000 nhân dân tệ, 1,3 triệu nhân dân tệ đã có thể mua được 65 chiếc GPU cao cấp dành cho người tiêu dùng này.
- Mặc dù H20 chắc chắn có sức mạnh hơn RTX 4090, nhưng chênh lệch giá khổng lồ khiến RTX 4090 trở thành giải pháp hiệu quả hơn về mặt giá cả. Chỉ những công ty lớn nhất như Baidu, Alibaba, Tencent và ByteDance mới có thể chi trả cho các chip AI đắt đỏ hơn.
- Một doanh nhân chủ yếu làm việc ở lớp ứng dụng AI cho biết họ đã thuê các chip A100 và H100 thông qua các dịch vụ điện toán đám mây và sau đó chuyển sang triển khai tại chỗ các phiên bản cũ hơn là V100 và RTX 3090. Với điều đó, họ tin rằng RTX 4090 nên đủ đáp ứng nhu cầu của họ.
- RTX 4090 đã trở thành lựa chọn hàng đầu của nhiều khách hàng cần các bộ xử lý AI. Một công ty được cho là đã sẵn sàng triển khai 100 GPU RTX 4090 vào tháng 8 này.
- Kể từ tháng 11 năm ngoái, các RTX 4090 đã bị hạn chế xuất khẩu sang Trung Quốc. Điều này đã khiến Nvidia tạo ra RTX 4090D chỉ dành riêng cho Trung Quốc, có ít lõi hơn và mức tiêu thụ điện thấp hơn. Tuy nhiên, các chip mà các công ty khởi nghiệp này đang mua là phiên bản RTX 4090 đầy đủ, không phải là phiên bản 4090D bị pha loãng.
- Mặc dù có các lệnh cấm vận và trừng phạt nhắm vào Trung Quốc, các tập đoàn và tổ chức vẫn có thể mua được số lượng lớn các chip này. Ví dụ, nếu một thực thể nhập khẩu bị chặn ở Mỹ, nó sẽ thay đổi tên hoặc địa chỉ và sau đó mua lại các GPU có khả năng AI trước khi cơ quan chức năng Mỹ biết đến hoạt động của nó và cấm lần thứ hai.

📌 Các công ty khởi nghiệp AI của Trung Quốc đang ngày càng ưa chuộng sử dụng GPU gaming RTX 4090 thay vì GPU AI H20 tuân thủ lệnh trừng phạt của Nvidia do sự chênh lệch giá quá lớn. RTX 4090 mang lại giá trị tốt hơn với hiệu suất đủ đáp ứng nhu cầu.

https://www.tomshardware.com/pc-components/gpus/chinese-ai-startups-turn-to-geforce-gaming-gpus-because-nvidia-sanction-compliant-ai-gpus-are-too-expensive

Không có file đính kèm.

Nguồn tham khảo

121

AI chips-hardware-compute 2024-08-13 10:38:38

NVIDIA ra mắt RTX 4090D với 48GB và RTX 4080 Super 32GB, cho điện toán đám mây tại Trung Quốc

- NVIDIA đã chính thức giới thiệu hai mẫu GPU mới là RTX 4090D với 48GB bộ nhớ và RTX 4080 Super với 32GB bộ nhớ, nhắm đến thị trường điện toán đám mây tại Trung Quốc.
- RTX 4090D được thiết kế để tối ưu hóa hiệu suất cho các ứng dụng yêu cầu xử lý đồ họa cao, như AI và học máy.
- RTX 4080 Super cũng không kém phần mạnh mẽ, cung cấp khả năng xử lý ấn tượng cho các tác vụ điện toán đám mây.
- Cả hai GPU này đều sử dụng kiến trúc Ada Lovelace, mang lại hiệu suất và hiệu quả năng lượng tốt hơn so với các thế hệ trước.
- Mô hình RTX 4090D với 48GB bộ nhớ GDDR6X, cho phép xử lý dữ liệu lớn và phức tạp mà không gặp phải tình trạng thiếu bộ nhớ.
- RTX 4080 Super với 32GB bộ nhớ cũng hứa hẹn mang lại trải nghiệm mượt mà cho người dùng trong các ứng dụng đòi hỏi cao.
- NVIDIA nhấn mạnh rằng các GPU mới này sẽ giúp cải thiện hiệu suất cho các dịch vụ điện toán đám mây, đặc biệt trong lĩnh vực AI và phân tích dữ liệu lớn.
- Sản phẩm hiện đã có mặt tại một số nhà cung cấp dịch vụ điện toán đám mây tại Trung Quốc, mở ra cơ hội mới cho các doanh nghiệp sử dụng công nghệ tiên tiến này.
- Sự ra mắt này đánh dấu bước tiến quan trọng của NVIDIA trong việc đáp ứng nhu cầu ngày càng tăng về hiệu suất tính toán trong môi trường điện toán đám mây.
- Các chuyên gia dự đoán rằng RTX 4090D và RTX 4080 Super sẽ tạo ra sự cạnh tranh mạnh mẽ trong thị trường GPU, đặc biệt là trong bối cảnh nhu cầu về điện toán đám mây đang gia tăng.

📌 NVIDIA đã ra mắt RTX 4090D 48GB và RTX 4080 Super 32GB, phục vụ điện toán đám mây tại Trung Quốc, với kiến trúc Ada Lovelace, hứa hẹn hiệu suất cao cho AI và phân tích dữ liệu lớn.

Citations:
[1] https://videocardz.com/newz/nvidia-geforce-rtx-4090d-with-48gb-and-rtx-4080-super-32gb-now-offered-in-china-for-cloud-computing

Không có file đính kèm.

Nguồn tham khảo

103

AI chips-hardware-compute 2024-08-11 06:08:40

Nvidia vẫn là ông vua AI nhờ chiến lược "vườn tường" kết hợp phần cứng và phần mềm

• Nvidia nổi tiếng với chip AI nhưng sức mạnh thực sự đến từ hệ sinh thái phần mềm "vườn tường" (walled garden) giống như Apple, giúp giữ chân khách hàng và ngăn cản đối thủ.

• Nền tảng phần mềm CUDA ra mắt năm 2007 là chìa khóa của "vườn tường" Nvidia, cho phép chạy các phần mềm phi đồ họa trên GPU của công ty.

• CUDA hiện có hơn 300 thư viện mã, 600 mô hình AI, hỗ trợ 3.700 ứng dụng tăng tốc GPU và được sử dụng bởi 5 triệu nhà phát triển tại 40.000 công ty.

• Nvidia có nhiều kỹ sư phần mềm hơn phần cứng, tập trung vào "điện toán full-stack" từ chip đến phần mềm xây dựng AI.

• Thị trường chip AI dự kiến đạt 400 tỷ USD/năm vào 2027, thu hút nhiều đối thủ cạnh tranh Nvidia.

• Các công ty như Intel, Google, Samsung đang phát triển giải pháp mã nguồn mở thay thế CUDA.

• Startup như Groq huy động được 640 triệu USD để cạnh tranh với chip của Nvidia.

• Google, Amazon, Microsoft đều đang phát triển chip AI riêng.

• AMD là đối thủ thành công nhất, dự kiến doanh thu 4,5 tỷ USD từ chip AI Instinct năm 2024. Công ty đã mua lại Silo AI với 665 triệu USD, bổ sung 300 kỹ sư AI.

• Tuy nhiên, Nvidia vẫn dự kiến giữ 90% thị phần chip AI trong 2-3 năm tới.

• NinjaTech AI là ví dụ về startup sử dụng chip tùy chỉnh của Amazon thay vì Nvidia do chi phí thấp hơn (250.000 USD/tháng so với 750.000-1,2 triệu USD/tháng).

• CEO Nvidia Jensen Huang cam kết giảm chi phí đào tạo AI trên phần cứng của công ty trong thế hệ chip tiếp theo.

📌 Nvidia duy trì vị thế dẫn đầu trong lĩnh vực AI nhờ chiến lược "vườn tường" kết hợp phần cứng-phần mềm. Với 90% thị phần chip AI, 5 triệu nhà phát triển sử dụng CUDA và hệ sinh thái phần mềm khổng lồ, Nvidia vẫn là "ông vua" không thể thay thế trong ngắn hạn dù đối mặt nhiều thách thức cạnh tranh.

https://www.wsj.com/tech/ai/ai-nvidia-apple-amd-jensen-huang-software-bb581f5a

#WSJ

Không có file đính kèm.

Nguồn tham khảo

130

AI chips-hardware-compute 2024-08-10 12:28:20

Intel ra mắt GPU mới cho ô tô tại Trung Quốc, tăng cường khả năng AI trong xe

• Intel vừa ra mắt GPU mới dành cho ô tô tại Trung Quốc, đánh dấu bước tiến vào thị trường ô tô điện lớn nhất thế giới giữa bối cảnh tăng trưởng chậm lại và cạnh tranh gay gắt trong lĩnh vực bán dẫn tiên tiến.

• GPU mới có tên Arc Graphics for Automotive, được thiết kế để cung cấp năng lực AI trong xe. Sản phẩm sẽ được triển khai thương mại trong buồng lái xe từ năm 2025.

• Jack Weast, Phó chủ tịch và Tổng giám đốc Intel Automotive, cho biết Trung Quốc là "thị trường thử nghiệm lý tưởng" cho công nghệ mới của Intel nhờ chu kỳ phát triển xe điện nhanh chóng và khả năng áp dụng công nghệ tiên tiến.

• GPU mới cho phép chạy các mô hình ngôn ngữ lớn (LLM) và trải nghiệm game AAA ngay trong xe, cũng như chạy các ứng dụng AI tạo sinh cục bộ thay vì trên đám mây.

• Động thái này phản ánh nhu cầu ngày càng tăng về sức mạnh tính toán trong buồng lái xe ngày càng tinh vi, khi các đối thủ như Nvidia và AMD cũng đẩy mạnh nỗ lực trong phân khúc chip ô tô.

• Intel đã chuyển trụ sở của bộ phận Automotive sang Trung Quốc và Tổng giám đốc Jack Weast cũng chuyển đến Bắc Kinh.

• Công ty đang tìm cách tăng cường quan hệ với Trung Quốc bất chấp áp lực từ Washington. Tháng 7/2023, Intel và chính quyền quận Nanshan (Thâm Quyến) đã cùng ra mắt Trung tâm Đổi mới Vùng Vịnh Lớn Intel tập trung vào các công nghệ như AI và điện toán biên.

• Intel đang phải đối mặt với kết quả tài chính không như mong đợi, cổ phiếu giảm gần 60% trong năm nay. Công ty thông báo sẽ cắt giảm hơn 15% lực lượng lao động (khoảng 17.500 người) và tạm ngừng chia cổ tức từ quý 4 như một phần của biện pháp cắt giảm chi phí.

• Việc cắt giảm nhân sự sẽ diễn ra trên toàn cầu, có thể ảnh hưởng đến nhân viên tại Trung Quốc.

📌 Intel ra mắt GPU Arc Graphics for Automotive tại Trung Quốc, nhắm đến thị trường ô tô điện 2,5 triệu xe/năm. Sản phẩm hỗ trợ AI trong xe, sẽ triển khai thương mại từ 2025. Đây là bước đi chiến lược của Intel trong bối cảnh cạnh tranh gay gắt với Nvidia, AMD trên thị trường chip ô tô.

https://www.scmp.com/tech/big-tech/article/3273965/intel-launches-new-chip-power-chinese-carmakers-advanced-vehicle-ai-initiatives

Không có file đính kèm.

Nguồn tham khảo

AI nghiên cứu AI chips-hardware-compute 2024-08-09 09:48:19

Trung Quốc phát triển chip AI quang học Taichi-II, hệ thống đào tạo AI đầu tiên trên thế giới hoạt động hoàn toàn bằng ánh sáng

• Nhóm nghiên cứu tại Đại học Tsinghua, Bắc Kinh đã phát triển chip AI quang học Taichi-II, hệ thống đào tạo AI đầu tiên trên thế giới hoạt động hoàn toàn bằng ánh sáng.

• Taichi-II là bản nâng cấp từ chip Taichi trước đó, cho phép mô hình hóa và đào tạo hoàn toàn dựa trên ánh sáng mà không cần sự hỗ trợ của máy tính điện tử.

• Nghiên cứu được công bố trên tạp chí Nature vào ngày 9/8/2024, do nhóm của giáo sư Fang Lu và Dai Qionghai thực hiện.

• Taichi-II được đánh giá là bước tiến quan trọng cho tính toán quang học, giúp chuyển từ giai đoạn lý thuyết sang ứng dụng thực nghiệm quy mô lớn.

• Chip mới có hiệu suất vượt trội so với phiên bản trước trong nhiều kịch bản:
- Tăng tốc đào tạo mạng quang học với hàng triệu tham số lên gấp 10 lần
- Tăng độ chính xác của các tác vụ phân loại lên 40%
- Cải thiện hiệu quả năng lượng trong môi trường ánh sáng yếu lên gấp 1 triệu lần

• Nhóm nghiên cứu phát triển phương pháp học FFM (Fully Forward Mode), cho phép thực hiện quá trình đào tạo trực tiếp trên chip quang học.

• FFM tận dụng các bộ điều chế và detector quang học tốc độ cao thương mại, có thể vượt trội hơn GPU trong việc học tăng tốc.

• Công nghệ này có thể là giải pháp thay thế sau khi Mỹ hạn chế Trung Quốc tiếp cận các chip GPU mạnh nhất để đào tạo AI.

• Nhóm nghiên cứu kỳ vọng những chip này sẽ tạo nền tảng cho sức mạnh tính toán quang học trong xây dựng mô hình AI trong tương lai.

📌 Chip AI quang học Taichi-II của Trung Quốc đạt bước tiến đột phá, hoạt động hoàn toàn bằng ánh sáng với hiệu suất vượt trội. Tăng tốc đào tạo mạng lên 10 lần, độ chính xác tăng 40%, hiệu quả năng lượng cải thiện gấp 1 triệu lần trong môi trường ánh sáng yếu. Mở ra triển vọng cho tính toán quang học quy mô lớn.

https://www.scmp.com/news/china/science/article/3273768/chinese-team-creates-worlds-first-ai-training-system-runs-entirely-light

Không có file đính kèm.

Nguồn tham khảo

212

AI chips-hardware-compute 2024-08-08 17:21:32

Cách tối ưu cơ sở hạ tầng cho AI tạo sinh: Chiến lược tiết kiệm chi phí từ các chuyên gia

• AI tạo sinh đòi hỏi lượng lớn tài nguyên tính toán, lưu trữ dữ liệu, băng thông mạng, điện năng và làm mát. IDC dự báo thị trường cơ sở hạ tầng AI toàn cầu sẽ tăng gấp đôi từ 28,1 tỷ USD năm 2022 lên 57 tỷ USD vào năm 2027.

• Khối lượng cơ sở hạ tầng cần thiết để xử lý các mô hình ngôn ngữ lớn (LLM) của AI tạo sinh đang trở nên không bền vững. Các nhà lãnh đạo CNTT đang tìm kiếm các chiến lược để đảm bảo ROI tích cực.

• Tại Northwestern Medicine, Mozziyar Etemadi đã chuyển sang sử dụng mô hình ngôn ngữ nhỏ (SLM) để giảm yêu cầu cơ sở hạ tầng. Họ đã xây dựng một cụm 4 máy chủ Dell PowerEdge XE9680 với 8 GPU Nvidia H100 để xử lý hình ảnh X-quang, tiết kiệm khoảng 50% chi phí so với dịch vụ đám mây.

• Northwestern Medicine sử dụng kết hợp lưu trữ đám mây và tại chỗ, chọn giải pháp phù hợp nhất cho từng trường hợp. Họ nhận thấy lưu trữ tại chỗ thường rẻ hơn đám mây.

• Papercup Technologies ban đầu sử dụng cụm GPU tại chỗ, tiết kiệm 60-70% so với đám mây. Tuy nhiên, khi mở rộng, họ gặp vấn đề về điện năng, làm mát và quản lý hệ thống.

• Papercup đã chuyển sang sử dụng AWS cho các tác vụ dịch và lồng tiếng, Google Cloud Platform cho đào tạo mô hình nặng, và giữ lại một số máy chủ tại chỗ cho đào tạo đơn giản hơn.

• GPU hiện tại tiêu thụ nhiều năng lượng (700W) và xu hướng này sẽ tiếp tục tăng. Các chuyên gia dự đoán sự xuất hiện của các bộ đồng xử lý AI chuyên dụng trong tương lai.

• Các giải pháp thay thế cho GPU bao gồm SLM, CPU dựa trên ARM, nhà cung cấp đám mây với chính sách phát thải bằng 0, vi xử lý sử dụng FPGA hoặc ASIC.

📌 AI tạo sinh đòi hỏi cơ sở hạ tầng khổng lồ, thách thức các CIO về chi phí và bền vững. Các chiến lược hiệu quả bao gồm sử dụng mô hình ngôn ngữ nhỏ, kết hợp linh hoạt giữa on-premises và đám mây, cũng như tìm kiếm các giải pháp phần cứng tiết kiệm năng lượng hơn như bộ đồng xử lý AI chuyên dụng.

https://www.cio.com/article/2128440/getting-infrastructure-right-for-generative-ai.html?amp=1

Không có file đính kèm.

Nguồn tham khảo

106

AI chips-hardware-compute 2024-08-07 00:27:52

Mainframe vẫn "sống khỏe" trong kỷ nguyên AI: từ ngân hàng đến hàng không vẫn cần "siêu máy tính" này

• Mainframe - máy tính lớn được phát minh từ nhiều thập kỷ trước vẫn đang chứng minh sức sống của mình trong kỷ nguyên AI hiện đại.

• Các ngành như ngân hàng, bảo hiểm và hàng không vẫn phụ thuộc vào mainframe để xử lý dữ liệu tốc độ cao. Một số đang tìm cách áp dụng AI trực tiếp trên mainframe thay vì trên đám mây.

• Đối với ngân hàng, việc phân tích các giao dịch có khả năng gian lận phải được thực hiện trong vài mili giây. Điều này chỉ có thể xảy ra trong thời gian thực trên mainframe.

• IBM là công ty lớn nhất trong lĩnh vực mainframe với hơn 96% thị phần, theo sau là NEC, Fujitsu và Hitachi.

• 45 trong số 50 ngân hàng hàng đầu và 4 trong số 5 hãng hàng không hàng đầu vẫn sử dụng mainframe làm nền tảng cốt lõi.

• Thị trường mainframe toàn cầu được định giá 3,05 tỷ USD vào năm 2023. Doanh số bán mainframe mới dự kiến sẽ giảm đến năm 2028.

• 54% lãnh đạo doanh nghiệp trong một cuộc khảo sát năm 2023 của Forrester cho biết họ sẽ tăng cường sử dụng mainframe trong 2 năm tới.

• Mainframe có thể xử lý tới 30.000 giao dịch mỗi giây với tốc độ cực nhanh. Phiên bản mới nhất của IBM zSystem có thể lưu trữ tới 40 terabyte dữ liệu, nặng tới 816 kg và có giá trên 1 triệu USD.

• IBM đã tích hợp khả năng AI vào mainframe. Phiên bản mới nhất có thể trả về kết quả ngay lập tức từ các mô hình AI.

• Mainframe được đánh giá cao về độ tin cậy và khả năng bảo vệ chống lại các cuộc tấn công mạng. Ngay cả khi một phần của máy tính bị hỏng, nó vẫn hoạt động được.

• Một số doanh nghiệp vẫn ưa thích quản lý mainframe và máy chủ của riêng họ thay vì phụ thuộc vào đám mây.

• Tuy nhiên, mainframe cũng có những hạn chế như khả năng mở rộng hạn chế, khó tích hợp với ứng dụng mới và tốn kém để quản lý.

• Các nỗ lực loại bỏ mainframe đã diễn ra trong nhiều năm, đặc biệt khi số lượng lập trình viên thành thạo ngôn ngữ COBOL ngày càng giảm.

• Một số công ty khởi nghiệp như Mechanical Orchard đang sử dụng AI để giúp viết lại các ứng dụng mainframe cũ bằng mã mới và chuyển chúng lên đám mây.

📌 Mặc dù có xu hướng giảm, mainframe vẫn đóng vai trò quan trọng trong xử lý dữ liệu tốc độ cao và ứng dụng AI cho nhiều ngành. IBM chiếm 96% thị phần, với 45/50 ngân hàng hàng đầu vẫn sử dụng. Tuy nhiên, việc chuyển đổi sang đám mây đang diễn ra, với các startup như Mechanical Orchard sử dụng AI để hiện đại hóa ứng dụng mainframe.

https://www.wsj.com/articles/mainframes-find-new-life-in-ai-era-1e32b951

#WSJ

Không có file đính kèm.

Nguồn tham khảo

101

AI startup-M&A AI chips-hardware-compute 2024-08-06 07:41:17

Groq, công ty khởi nghiệp chip AI, huy động được 640 triệu USD từ các nhà đầu tư lớn, nâng giá trị lên 2,8 tỷ USD

• Groq, công ty khởi nghiệp chip AI, vừa huy động được 640 triệu USD từ các nhà đầu tư lớn như BlackRock, Cisco và Samsung Catalyst Fund.

• Giá trị của Groq tăng gấp đôi lên 2,8 tỷ USD so với mức 1,1 tỷ USD năm 2021.

• Yann LeCun, nhà khoa học AI trưởng của Meta, sẽ trở thành cố vấn kỹ thuật cho Groq.

• Groq là một trong số các công ty chip hưởng lợi từ sự bùng nổ sử dụng các mô hình AI như ChatGPT hay Google Gemini.

• Nvidia hiện là công ty lớn nhất trong lĩnh vực chip AI với các GPU mạnh mẽ dùng để huấn luyện mô hình AI tiên tiến.

• Khác với Nvidia, Groq tập trung vào chip triển khai AI (inference) - quá trình mô hình sử dụng dữ liệu đã được huấn luyện để trả lời câu hỏi.

• Groq tuyên bố chip LPU (Language Processing Unit) của họ nhanh hơn và tiết kiệm năng lượng hơn so với đối thủ.

• Jonathan Ross, CEO Groq và cựu kỹ sư Google, cho biết công ty sẽ triển khai hơn 108.000 LPU vào cuối tháng 3/2025.

• Mục tiêu của Groq là xử lý một nửa lượng inference trên toàn cầu vào cuối năm 2025.

• BlackRock sẽ đóng vai trò quan trọng, không chỉ là nhà đầu tư mà còn là đối tác lâu dài của Groq.

• Groq đã hợp tác với nhiều công ty lớn như Meta, Samsung và cả các quốc gia như Ả Rập Saudi để sản xuất và triển khai chip.

• Công ty đã ký thỏa thuận với Aramco Digital và Earth Wind & Power để xây dựng năng lực tính toán và cung cấp chip.

• Ross khẳng định Groq làm việc chặt chẽ với Bộ Thương mại Mỹ và không gặp vấn đề gì với các đối tác Trung Đông.

📌 Groq đã huy động thành công 640 triệu USD, nâng giá trị lên 2,8 tỷ USD, gấp đôi so với năm 2021. Công ty tập trung vào chip triển khai AI, đặt mục tiêu xử lý 50% lượng inference toàn cầu vào cuối 2025 với hơn 108.000 LPU được triển khai.

https://www.ft.com/content/654f44d9-be74-4097-9e9b-77fdef5454bd

#FT

Không có file đính kèm.

Nguồn tham khảo

189

AI chips-hardware-compute AI startup-M&A 2024-08-05 21:03:40

Startup Groq gọi vốn thành công 640 triệu USD, thách thức vị thế của Nvidia

• Groq, startup phát triển chip chạy mô hình AI tạo sinh nhanh hơn các bộ xử lý thông thường, vừa huy động thành công 640 triệu USD trong vòng gọi vốn mới do Blackrock dẫn đầu.

• Các nhà đầu tư khác tham gia bao gồm Neuberger Berman, Type One Ventures, Cisco, KDDI và Samsung Catalyst Fund.

• Vòng gọi vốn này nâng tổng số tiền Groq huy động được lên hơn 1 tỷ USD và định giá công ty ở mức 2,8 tỷ USD.

• Ban đầu, Groq dự định gọi 300 triệu USD với mức định giá 2,5 tỷ USD, nhưng đã vượt xa kỳ vọng ban đầu.

• Định giá mới gấp đôi so với mức định giá trước đó (~1 tỷ USD) vào tháng 4/2021.

• Yann LeCun, Giám đốc khoa học AI của Meta, sẽ làm cố vấn kỹ thuật cho Groq.

• Stuart Pann, cựu lãnh đạo bộ phận foundry của Intel và cựu CIO của HP, sẽ gia nhập Groq với vị trí Giám đốc điều hành.

• Groq đang phát triển công cụ suy luận LPU (language processing unit). Công ty tuyên bố LPU có thể chạy các mô hình AI tạo sinh hiện có nhanh gấp 10 lần và tiêu thụ năng lượng bằng 1/10 so với các chip thông thường.

• CEO Jonathan Ross của Groq nổi tiếng với việc giúp phát minh ra tensor processing unit (TPU), chip AI tùy chỉnh của Google.

• Groq cung cấp nền tảng phát triển GroqCloud chạy trên LPU, hỗ trợ các mô hình "mở" như Llama 3.1 của Meta, Gemma của Google, Whisper của OpenAI và Mixtral của Mistral.

• Tính đến tháng 7, GroqCloud có hơn 356.000 nhà phát triển sử dụng.

• Theo ước tính của Groq, hơn 75% các công ty trong danh sách Fortune 100 đã có đại diện sử dụng nền tảng của họ.

• Một phần số tiền huy động được sẽ được sử dụng để mở rộng năng lực và bổ sung thêm các mô hình và tính năng mới.

📌 Groq gọi vốn thành công 640 triệu USD, nâng tổng số tiền huy động lên hơn 1 tỷ USD và định giá công ty ở mức 2,8 tỷ USD. Với công nghệ chip LPU độc đáo và sự hỗ trợ từ các chuyên gia hàng đầu, Groq đang thách thức vị thế của Nvidia trong lĩnh vực chip AI.

https://techcrunch.com/2024/08/05/ai-chip-startup-groq-lands-640m-to-challenge-nvidia/

Không có file đính kèm.

Nguồn tham khảo

139

AI market AI chips-hardware-compute 2024-08-05 06:22:23

Cách Trung Quốc vượt lệnh cấm AI của Mỹ: từ buôn lậu đến công ty bình phong

• Mỹ đã cố gắng ngăn chặn Trung Quốc tiếp cận chip AI Nvidia để phát triển quân sự, nhưng khu vực tư nhân đang tìm cách vượt qua lệnh cấm.

• Tại chợ điện tử SEG ở Thâm Quyến, các nhà cung cấp công khai bán chip AI bị cấm. Một người bán cho biết có thể đặt hàng và giao chip trong vòng 2 tuần.

• Một chủ doanh nghiệp khác chia sẻ đã vận chuyển một lô lớn máy chủ chứa hơn 2.000 chip Nvidia tiên tiến nhất từ Hong Kong vào Trung Quốc đại lục, trị giá 103 triệu USD.

• Mỹ đã thiết lập một trong những lệnh cấm công nghệ toàn diện nhất từ trước đến nay vào tháng 10/2022, cấm xuất khẩu chip AI và máy móc sản xuất chúng sang Trung Quốc.

• Tuy nhiên, các doanh nghiệp trên toàn cầu đã tìm ra cách để vượt qua các hạn chế do lợi nhuận khổng lồ.

• Một số công ty Trung Quốc đã thành lập các công ty mới để tránh lệnh cấm. Ví dụ như Nettrix, một trong những nhà sản xuất máy chủ AI lớn nhất Trung Quốc, được thành lập bởi các cựu lãnh đạo của Sugon - công ty bị Mỹ đưa vào danh sách đen.

• Nettrix nhanh chóng trở thành đối tác của Nvidia, Intel và Microsoft. Công ty này đã bán máy chủ chứa chip Nvidia và Intel cho nhiều tổ chức, bao gồm cả những đơn vị sau đó bị Mỹ đưa vào danh sách đen.

• Chip của Mỹ đã giúp đẩy nhanh chương trình tên lửa của Trung Quốc. Ví dụ, chip A100 bị cấm của Nvidia đã được sử dụng tại Đại học Trung Sơn để mô phỏng tên lửa và ngư lôi.

• Nvidia đã nhanh chóng điều chỉnh bằng cách tạo ra phiên bản chip A800 giảm hiệu năng để bán cho Trung Quốc, nhưng sau đó cũng bị cấm vào tháng 10/2023.

• Tại chợ điện tử Thâm Quyến, nhiều nhà cung cấp cho biết họ bán hoặc vận chuyển hàng trăm hoặc hàng nghìn chip Nvidia bị cấm, bao gồm cả A100 và H100.

• Các chuyên gia cho rằng với mức độ buôn lậu vừa phải, lệnh cấm sẽ làm chậm sự phát triển thương mại ở Trung Quốc nhưng có thể không cản trở nghiên cứu quân sự có mục tiêu.

📌 Mặc dù Mỹ đã nỗ lực kiểm soát xuất khẩu chip AI sang Trung Quốc, một thị trường ngầm sôi động vẫn tồn tại. Các công ty bình phong và buôn lậu đang giúp Trung Quốc tiếp cận công nghệ bị cấm, với các giao dịch lên tới hàng trăm triệu USD. Điều này có thể làm chậm sự phát triển thương mại nhưng khó ngăn cản hoàn toàn nghiên cứu quân sự của Trung Quốc.

https://www.nytimes.com/2024/08/04/technology/china-ai-microchips.html

Không có file đính kèm.

Nguồn tham khảo

AI market AI chips-hardware-compute 2024-08-05 05:36:20

Lộ giao dịch chip AI trị giá hơn 100 triệu USD tại Trung Quốc bất chấp lệnh cấm của Mỹ

• Một cuộc điều tra của New York Times đã phát hiện ra việc buôn bán chip AI tiên tiến vẫn đang diễn ra tại Trung Quốc, bất chấp các hạn chế xuất khẩu của Mỹ. Báo cáo cho thấy có hàng chục nhà cung cấp ở Thâm Quyến đang thực hiện các giao dịch trị giá hơn 100 triệu USD, chủ yếu là chip của Nvidia.

• Một thương nhân đã cung cấp bằng chứng về một lô hàng gồm hơn 2.000 chip tiên tiến nhất của Nvidia, trị giá 103 triệu USD, được vận chuyển từ Hong Kong vào Trung Quốc đại lục vào tháng 4. Nhiều thương nhân cho biết khách hàng thường đặt hàng 200 đến 300 chip mỗi lần.

• Mặc dù số lượng chính xác không rõ ràng, nhưng các giao dịch được báo cáo với New York Times lớn hơn nhiều so với những gì được biết trước đây. Nvidia và các công ty Mỹ khác nói rằng họ tuân thủ các quy định xuất khẩu nhưng không thể kiểm soát toàn bộ chuỗi phân phối của mình.

• Cuộc điều tra phát hiện hơn một chục tổ chức nhà nước Trung Quốc, bao gồm cả những tổ chức có liên hệ với quân đội, cũng đã mua các chip bị cấm. Những chip này được sử dụng cho nghiên cứu về vũ khí hạt nhân, ngư lôi và máy bay chiến đấu tàng hình của Trung Quốc.

• Nvidia vẫn tiếp tục bán hợp pháp các chip AI ít mạnh mẽ hơn cho các công ty Trung Quốc, bao gồm 24 đối tác có liên hệ với quân đội.

• Các công ty đang tìm cách vượt qua các hạn chế thông qua các quan hệ đối tác mới và các công ty con ở nước ngoài. Ví dụ, sau các lệnh trừng phạt của Mỹ, các nhà quản lý từ Sugon đã thành lập Nettrix, hiện là một trong những nhà sản xuất máy chủ AI lớn nhất của Trung Quốc. Nvidia, Intel và Microsoft đều làm việc với công ty này và nói rằng họ tuân thủ pháp luật.

• Bộ trưởng Thương mại Gina Raimondo nói với New York Times: "Đây là một công việc cực kỳ khó khăn, và tôi không ảo tưởng rằng chúng tôi đang làm nó một cách hoàn hảo."

• Mỹ đã đưa ra các hạn chế xuất khẩu vào tháng 9 năm 2022 nhằm ngăn chặn Trung Quốc, Nga và Iran có được các chip AI tiên tiến có thể tạo ra những bước đột phá, đặc biệt là cho mục đích quân sự. Mỹ cũng hạn chế xuất khẩu sang một số quốc gia Trung Đông để ngăn chặn việc tiếp cận thông qua các nước thứ ba.

• Kể từ khi quy định được đưa ra, nó đã được điều chỉnh nhiều lần để theo kịp các phát triển kỹ thuật mới. Các nhà sản xuất chip của Mỹ cũng bị cấm xây dựng các nhà máy chip ở Trung Quốc.

• Cuộc đua AI giữa Mỹ và Trung Quốc có thể đang nóng lên: Mỹ được cho là đang xem xét cấm các mô hình AI. OpenAI gần đây đã hạn chế quyền truy cập vào giao diện lập trình của mình từ Trung Quốc và các quốc gia khác. CEO OpenAI Sam Altman gần đây đã cảnh báo về những rủi ro của các mô hình AI tiên tiến trong tay các chế độ độc tài.

📌 Cuộc điều tra của New York Times tiết lộ việc buôn bán chip AI trị giá hơn 100 triệu USD tại Trung Quốc bất chấp lệnh cấm của Mỹ. Hơn một chục tổ chức nhà nước Trung Quốc đã mua chip bị cấm cho nghiên cứu quân sự. Các công ty đang tìm cách vượt qua hạn chế thông qua đối tác mới và công ty con nước ngoài.

https://the-decoder.com/banned-nvidia-ai-chips-worth-over-100-million-shipped-to-china-despite-us-export-restrictions/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2024-08-04 19:17:57

Thị trường ngầm chip AI cấm tại Trung Quốc trị giá hàng trăm triệu đô

• Cuộc điều tra của New York Times phát hiện một thị trường ngầm sôi động về chip AI bị cấm tại Trung Quốc, bất chấp lệnh cấm của Mỹ vì lý do an ninh quốc gia.

• Phóng viên đã phỏng vấn đại diện của 11 công ty Trung Quốc thừa nhận bán hoặc vận chuyển chip Nvidia bị cấm, và tìm thấy hàng chục doanh nghiệp khác chào bán trực tuyến.

• Tại một khu chợ điện tử ở Thâm Quyến, nhiều nhà cung cấp báo cáo các giao dịch lên tới hàng trăm hoặc hàng nghìn chip, bao gồm một thương vụ trị giá 103 triệu USD.

• Hơn một chục tổ chức nhà nước Trung Quốc đã mua chip bị hạn chế, trong đó có các đơn vị bị trừng phạt vì hiện đại hóa quân đội.

• Các công ty trên toàn cầu đã tìm cách lách luật bằng cách chuyển hướng kinh doanh thông qua các đối tác và công ty con ở nước ngoài mới.

• Một số doanh nghiệp đã tránh được danh sách hạn chế bằng cách thành lập công ty mới hoặc chỉ đơn giản là thay đổi địa chỉ đăng ký.

• Điều tra phát hiện một trường hợp các giám đốc Trung Quốc thành lập công ty mới để vượt qua hạn chế của Mỹ, nay trở thành một trong những nhà sản xuất máy chủ AI lớn nhất Trung Quốc.

• Chip của Mỹ đã được sử dụng trong các hệ thống siêu máy tính giúp các nhà nghiên cứu Trung Quốc mô hình hóa vũ khí hạt nhân, ngư lôi và phân tích chữ ký radar của máy bay tàng hình.

• Nvidia vẫn hợp pháp bán chip ít mạnh hơn cho các công ty Trung Quốc, một số có liên kết quân sự.

• Trong số 136 đối tác Trung Quốc của Nvidia, ít nhất 24 công ty có hợp đồng mua sắm với quân đội hoặc thuộc sở hữu một phần của các nhà thầu quốc phòng.

📌 Cuộc điều tra của New York Times cho thấy một thị trường ngầm chip AI bị cấm trị giá hàng trăm triệu USD tại Trung Quốc, với sự tham gia của nhiều công ty và tổ chức nhà nước. Chip Mỹ đã được sử dụng trong nghiên cứu quân sự Trung Quốc bất chấp lệnh cấm, cho thấy thách thức trong việc thực thi các hạn chế công nghệ.

https://www.nytimes.com/2024/08/04/technology/china-ai-microchips-takeaways.html

Không có file đính kèm.

Nguồn tham khảo

129

AI chips-hardware-compute 2024-08-04 05:37:04

Chip AI trong dòng Blackwell sắp ra mắt của Nvidia sẽ bị trì hoãn do lỗi thiết kế

• Theo báo cáo của The Information, chip AI sắp ra mắt của Nvidia sẽ bị trì hoãn do lỗi thiết kế. Thông tin này được tiết lộ bởi hai nguồn tin giấu tên tham gia sản xuất chip và phần cứng máy chủ của nó.

• Các chip có thể bị trì hoãn 3 tháng hoặc hơn, điều này có thể ảnh hưởng đến các khách hàng lớn của Nvidia như Meta Platforms Inc., Google LLC và Microsoft Corp.

• Trong tuần này, Nvidia đã thông báo cho Microsoft về việc trì hoãn ảnh hưởng đến các mẫu chip AI tiên tiến nhất trong dòng Blackwell.

• Việc trì hoãn này đồng nghĩa với việc các lô hàng lớn dự kiến sẽ không được giao cho đến quý 1 năm 2025.

• Một người phát ngôn của Nvidia từ chối bình luận về các tuyên bố với khách hàng về sự chậm trễ, nhưng nói với The Information rằng "sản xuất đang đúng tiến độ để tăng tốc" vào cuối năm nay.

• Microsoft, Google, Amazon Web Services và Meta đều từ chối bình luận về thông tin này khi được The Information liên hệ.

• Người phát ngôn của TSMC không phản hồi yêu cầu bình luận.

• Thông tin này được công bố vào ngày 3 tháng 8 năm 2024, lúc 3:37 sáng theo giờ UTC.

• Trước đó, Elliott Management đã tuyên bố Nvidia đang trong một "bong bóng" và AI đang bị "thổi phồng quá mức", theo báo cáo của Financial Times.

• Việc trì hoãn này có thể gây ra tác động đáng kể đến thị trường chip AI, vốn đang phát triển nhanh chóng và cạnh tranh gay gắt.

• Dòng chip Blackwell được kỳ vọng sẽ là bước tiến quan trọng tiếp theo trong công nghệ AI của Nvidia, sau thành công của dòng H100 hiện tại.

• Sự chậm trễ này có thể tạo cơ hội cho các đối thủ cạnh tranh như AMD và Intel trong việc thu hẹp khoảng cách với Nvidia trong lĩnh vực chip AI.

📌 Nvidia gặp trở ngại lớn khi chip AI mới bị trì hoãn đến Q1 2025 do lỗi thiết kế. Điều này ảnh hưởng đến các khách hàng lớn như Microsoft, Meta và Google, đồng thời có thể tác động đến vị thế dẫn đầu của Nvidia trong thị trường chip AI đang phát triển nhanh chóng.

https://www.bloomberg.com/news/articles/2024-08-03/nvidia-s-new-ai-chip-delayed-due-to-design-flaws-information

Không có file đính kèm.

Nguồn tham khảo

121

AI chips-hardware-compute 2024-08-02 22:53:41

Cuộc gọi từ IBM đã khơi dậy tham vọng chip của Nhật Bản như thế nào?

• Rapidus, startup Nhật Bản, chuẩn bị bắt đầu sản xuất thử nghiệm chip 2nm tiên tiến nhất của nước này vào tháng 4/2024.

• Dự án bắt đầu từ cuộc gọi của John E. Kelly III của IBM tới Tetsuro Higashi, cựu chủ tịch Tokyo Electron vào năm 2020. IBM muốn sản xuất hàng loạt chip 2nm mới thiết kế tại Nhật Bản.

• Nhật Bản không phải lựa chọn hiển nhiên vì ngành công nghiệp chip đã bị vượt qua bởi TSMC và Samsung. Chip tiên tiến nhất của Nhật lúc đó là 40nm.

• IBM có thể muốn đa dạng hóa nguồn cung ứng công nghệ, không phụ thuộc vào một nhà cung cấp. Samsung và TSMC đã từ chối hợp tác với IBM về chip 2nm.

• Chính phủ Nhật cam kết hỗ trợ Rapidus tới 920 tỷ yên (6 tỷ USD), chủ yếu cho R&D.

• Nhà máy đầu tiên của Rapidus đang được xây dựng ở Hokkaido, dự kiến sản xuất hàng loạt vào năm 2027.

• Một số chuyên gia hoài nghi về dự án, cho rằng công nghệ sẽ chậm 2 năm so với đối thủ toàn cầu khi bắt đầu sản xuất năm 2027.

• Rapidus nhắm tới các startup chip AI làm khách hàng ban đầu, những công ty có thể gặp khó khăn khi đặt hàng từ TSMC.

• Công ty hứa hẹn thời gian phản hồi nhà máy nhanh hơn và sẵn sàng sản xuất lô nhỏ chip chuyên biệt.

• Rapidus đặt mục tiêu doanh số hơn 1 nghìn tỷ yên vào năm 2030, sớm hơn so với kế hoạch ban đầu là năm 2040.

• IBM sẽ mời khoảng 200 kỹ sư của Rapidus tới trung tâm nghiên cứu ở Albany, New York để học công nghệ sản xuất hàng loạt chip 2nm.

📌 Rapidus đang đặt cược vào thị trường chip AI chuyên dụng, với mục tiêu trở thành nhà cung cấp toàn diện cho các startup. Dù đối mặt với nhiều thách thức, dự án này đánh dấu nỗ lực của Nhật Bản nhằm khôi phục vị thế trong ngành công nghiệp bán dẫn toàn cầu.

https://asia.nikkei.com/Business/Business-Spotlight/Rapidus-How-a-phone-call-from-IBM-reignited-Japan-s-chip-ambitions

Không có file đính kèm.

Nguồn tham khảo

107

AI chips-hardware-compute Semi-Cloud-DC-Green 2024-08-01 23:19:25

Oracle thách thức các ông lớn đám mây với dàn vũ khí phần cứng AI mới từ Nvidia

• Oracle vừa công bố mở rộng hợp tác với Nvidia, giới thiệu các tùy chọn GPU mới và dịch vụ cơ sở hạ tầng AI trên Oracle Cloud Infrastructure (OCI).

• Trọng tâm của thông báo là việc bổ sung GPU Nvidia L40S vào danh mục sản phẩm tính toán của OCI và các tùy chọn máy ảo mới cho GPU Nvidia H100 Tensor Core.

• GPU L40S được định vị là tùy chọn đa năng cho nhiều khối lượng công việc AI, bao gồm suy luận, đào tạo các mô hình nhỏ hơn và các ứng dụng đồ họa chuyên sâu như digital twins.

• Oracle cung cấp các tùy chọn GPU mới này ở cả cấu hình bare metal và máy ảo, mang lại cho khách hàng nhiều lựa chọn hơn trong việc triển khai khối lượng công việc AI.

• Dịch vụ "OCI Supercluster" của Oracle hiện hỗ trợ lên tới 65.000 GPU NVIDIA, nhắm đến các tổ chức đào tạo các mô hình AI lớn nhất với hàng trăm tỷ tham số.

• Động thái này được xem là chiến lược của Oracle nhằm cạnh tranh mạnh mẽ hơn trên thị trường đám mây AI do Amazon Web Services, Microsoft Azure và Google Cloud thống trị.

• Sự hợp tác cũng mang lại lợi ích cho Nvidia, cung cấp một nền tảng đám mây lớn khác để giới thiệu công nghệ GPU mới nhất và mở rộng tầm ảnh hưởng trên thị trường doanh nghiệp.

• Đối với doanh nghiệp, những tùy chọn mới này mang đến cơ hội để tối ưu hóa đầu tư cơ sở hạ tầng AI, tiềm năng giảm rào cản gia nhập cho các tổ chức nhỏ hơn đồng thời cung cấp quy mô cần thiết cho các khối lượng công việc AI đòi hỏi cao nhất.

• Oracle đặt mục tiêu phục vụ mọi loại khách hàng, từ các công ty công nghệ lớn lưu trữ các mô hình khổng lồ đến các nhóm kỹ thuật nhỏ làm việc trên các ứng dụng chuyên biệt.

• Cuộc đua giữa các nhà cung cấp đám mây để cung cấp cơ sở hạ tầng AI mạnh mẽ và linh hoạt nhất đang ngày càng gay gắt, và Oracle đã thể hiện rõ tham vọng AI của mình với thông báo này.

📌 Oracle mở rộng hợp tác với Nvidia, giới thiệu GPU L40S và nâng cấp OCI Supercluster hỗ trợ 65.000 GPU. Động thái này nhằm cạnh tranh với các ông lớn đám mây trong lĩnh vực AI, cung cấp giải pháp linh hoạt cho doanh nghiệp mọi quy mô, từ đào tạo mô hình lớn đến ứng dụng chuyên biệt.

https://venturebeat.com/ai/oracle-challenges-cloud-giants-with-new-nvidia-ai-hardware-offerings/

Không có file đính kèm.

Nguồn tham khảo

124

AI chips-hardware-compute 2024-08-01 22:54:37

Meta cần gấp 10 lần sức mạnh tính toán để huấn luyện Llama 4 so với Llama 3

• Mark Zuckerberg tuyên bố Meta sẽ cần gấp 10 lần sức mạnh tính toán để huấn luyện Llama 4 so với Llama 3.

• Zuckerberg muốn xây dựng năng lực trước khi cần thiết hơn là quá muộn, do thời gian chuẩn bị cho các dự án suy luận mới khá dài.

• Meta phát hành Llama 3 với 80 tỷ tham số vào tháng 4/2024. Gần đây họ ra mắt phiên bản nâng cấp Llama 3.1 405B với 405 tỷ tham số, là mô hình nguồn mở lớn nhất của Meta.

• CFO Susan Li cho biết Meta đang cân nhắc các dự án trung tâm dữ liệu và xây dựng năng lực để huấn luyện các mô hình AI trong tương lai.

• Đầu tư này dự kiến sẽ làm tăng chi tiêu vốn của Meta trong năm 2025.

• Chi tiêu vốn của Meta đã tăng gần 33% lên 8,5 tỷ USD trong Q2 2024, từ 6,4 tỷ USD một năm trước, chủ yếu do đầu tư vào máy chủ, trung tâm dữ liệu và cơ sở hạ tầng mạng.

• Theo báo cáo của The Information, OpenAI chi 3 tỷ USD để huấn luyện mô hình và thêm 4 tỷ USD để thuê máy chủ với giá ưu đãi từ Microsoft.

• Meta đang xây dựng cơ sở hạ tầng linh hoạt để có thể chuyển hướng năng lực huấn luyện sang suy luận AI tạo sinh hoặc công việc xếp hạng và đề xuất cốt lõi khi cần thiết.

• Ấn Độ là thị trường lớn nhất của chatbot Meta AI.

• Meta không kỳ vọng các sản phẩm AI tạo sinh sẽ đóng góp đáng kể vào doanh thu trong thời gian tới.

📌 Meta cần gấp 10 lần sức mạnh tính toán để huấn luyện Llama 4 so với Llama 3. Zuckerberg muốn đầu tư sớm vào năng lực AI. Chi tiêu vốn Q2/2024 tăng 33% lên 8,5 tỷ USD. Ấn Độ là thị trường lớn nhất của Meta AI.

https://techcrunch.com/2024/08/01/zuckerberg-says-meta-will-need-10x-more-computing-power-to-train-llama-4-than-llama-3/

Không có file đính kèm.

Nguồn tham khảo

211

AI chips-hardware-compute 2024-07-31 14:48:52

AMD chuyển mình thành công ty chip AI, doanh số GPU AI tăng vọt

• AMD vừa công bố kết quả kinh doanh quý 2/2024, với gần một nửa doanh số đến từ mảng sản phẩm trung tâm dữ liệu.

• Mảng kinh doanh trung tâm dữ liệu của AMD đã tăng gấp đôi trong một năm, chủ yếu nhờ chip AI Instinct MI300 cạnh tranh với H100 của Nvidia.

• Doanh số MI300 đạt hơn 1 tỷ USD trong một quý, tăng từ mốc 1 tỷ USD tích lũy kể từ khi ra mắt vào tháng 12/2023.

• AMD đang theo đuổi chiến lược tương tự Nvidia, tập trung vào phát triển chip AI mới hàng năm. Công ty dự kiến ra mắt MI325X vào Q4/2024, MI350 năm 2025 và MI400 năm 2026.

• CEO Lisa Su cho biết MI350 sẽ "rất cạnh tranh" với chip Blackwell của Nvidia.

• Nguồn cung MI300 vẫn sẽ khan hiếm đến năm 2025 do nhu cầu cao.

• Doanh thu mảng trung tâm dữ liệu của AMD (2,8 tỷ USD/quý) vẫn còn nhỏ so với Nvidia (22,6 tỷ USD/quý).

• Mảng CPU và GPU cho máy tính cá nhân của AMD tăng trưởng trong quý vừa qua. Doanh số Ryzen tăng 49% so với cùng kỳ năm trước.

• Doanh số GPU Radeon 6000 tăng so với năm trước, bất chấp doanh thu gaming giảm 59% do sụt giảm bán PlayStation và Xbox.

• AMD xác nhận hơn 100 nền tảng sẽ trang bị chip Ryzen AI 300 "Strix Point", bao gồm các sản phẩm từ Asus, HP, MSI, Acer và Lenovo.

📌 AMD đang chuyển mình thành công ty chip AI, với doanh số GPU AI tăng vọt lên 1 tỷ USD/quý. Mảng trung tâm dữ liệu tăng trưởng 115%, chiếm gần 50% doanh thu. AMD đặt mục tiêu ra mắt chip AI mới hàng năm để cạnh tranh với Nvidia.

https://www.theverge.com/2024/7/30/24209938/amd-q2-2024-earnings-datacenter-ai-revenue

Không có file đính kèm.

Nguồn tham khảo

117

AI chips-hardware-compute Semi-Cloud-DC-Green 2024-07-31 14:38:17

Cổ phiếu Microsoft giảm 6% sau công bố kết quả quý 4 không đạt kỳ vọng doanh thu đám mây, gây thất vọng về tiềm năng AI

• Microsoft công bố kết quả tài chính quý 4, vượt kỳ vọng về doanh thu và lợi nhuận trên mỗi cổ phiếu (EPS), nhưng không đạt kỳ vọng về doanh thu đám mây.

• EPS đạt 2,95 USD trên doanh thu 64,7 tỷ USD, so với dự báo 2,94 USD và 64,5 tỷ USD. Cùng kỳ năm ngoái, EPS là 2,69 USD và doanh thu 56,2 tỷ USD.

• Doanh thu đám mây tổng thể đạt 36,8 tỷ USD, đúng kỳ vọng. Tuy nhiên, doanh thu mảng Intelligent Cloud (bao gồm Azure) chỉ đạt 28,5 tỷ USD, thấp hơn dự báo 28,7 tỷ USD.

• Cổ phiếu Microsoft giảm hơn 7% trong phiên giao dịch sau giờ.

• Dù vậy, doanh thu tổng thể vẫn tăng 21% so với cùng kỳ năm trước. Doanh thu Intelligent Cloud tăng 19%.

• Microsoft cho biết các dịch vụ AI đóng góp 8 điểm phần trăm vào tăng trưởng doanh thu Azure và các dịch vụ đám mây khác, tăng 29%.

• Kết quả của Microsoft cũng kéo theo cổ phiếu các công ty công nghệ lớn khác giảm, như Meta giảm hơn 3% sau giờ giao dịch chính.

• Tuần trước, Alphabet (công ty mẹ của Google) cũng công bố kết quả kinh doanh, cho thấy doanh thu đám mây tăng một phần nhờ sự quan tâm đến các sản phẩm AI.

• Tuy nhiên, Google không đưa ra con số cụ thể về tác động của AI đến mảng đám mây. Một số nhà phân tích dự đoán lợi ích doanh thu từ đầu tư AI của Google có thể chưa xuất hiện đến nửa đầu năm 2025.

• Theo nhà phân tích Karl Keirstead của UBS, Microsoft đang giành thêm thị phần từ Google và Amazon nhờ dẫn đầu trong lĩnh vực AI.

📌 Microsoft công bố kết quả tài chính quý 4 không đạt kỳ vọng về doanh thu đám mây, khiến cổ phiếu giảm hơn 6%. Dù doanh thu tổng thể tăng 21%, kết quả này gây thất vọng về tiềm năng AI và ảnh hưởng đến cổ phiếu các công ty công nghệ lớn khác. Microsoft đang giành thêm thị phần nhờ dẫn đầu trong AI.

https://finance.yahoo.com/news/microsoft-stock-drops-over-6-after-results-fall-short-in-latest-ai-disappointment-201321390.html

Không có file đính kèm.

Nguồn tham khảo

118

AI chips-hardware-compute AI pháp lý-quản trị-chủ quyền 2024-07-31 07:29:43

EU khởi động sáng kiến "Nhà máy AI" nhằm cạnh tranh toàn cầu

• Cơ quan siêu máy tính châu Âu EuroHPC JU chính thức bổ sung mục tiêu phát triển và vận hành "Nhà máy AI" vào chiến lược của mình, nhằm thúc đẩy hệ sinh thái AI cạnh tranh và đổi mới hơn ở châu Âu.

• Quyết định này được đưa ra sau khi Quy định EU 2024/1732 có hiệu lực, mở rộng nhiệm vụ của EuroHPC JU trong việc mua sắm và vận hành các siêu máy tính tối ưu hóa cho AI.

• "Nhà máy AI" được coi là hệ sinh thái năng động, tập hợp các yếu tố cần thiết như sức mạnh tính toán, dữ liệu và nhân tài để tạo ra các mô hình AI tạo sinh tiên tiến.

• Mục tiêu cuối cùng là các Nhà máy AI sẽ trở thành trung tâm thúc đẩy tiến bộ AI trong nhiều lĩnh vực quan trọng như y tế, năng lượng, sản xuất và khí tượng học.

• EuroHPC JU sẽ triển khai cách tiếp cận hai hướng từ tháng 9:
- Kêu gọi thỏa thuận lưu trữ mới để mua sắm siêu máy tính AI mới hoặc nâng cấp siêu máy tính hiện có
- Dành cho các đơn vị đã lưu trữ siêu máy tính EuroHPC có khả năng đào tạo mô hình AI quy mô lớn

• Ngân sách dự kiến:
- 400 triệu euro cho năm 2024
- Lên đến 800 triệu euro đến năm 2027, tùy thuộc vào ngân sách từ chương trình Châu Âu Kỹ thuật số

• Nvidia cũng đang thúc đẩy khái niệm "Nhà máy AI":
- CEO Jensen Huang mô tả đây là các trung tâm dữ liệu được xây dựng đặc biệt để xử lý các tác vụ AI đòi hỏi tính toán cao nhất
- Huang cho rằng "Nhà máy AI sẽ trở thành nền tảng của nền kinh tế hiện đại trên toàn thế giới"

• Sáng kiến này nhằm tạo ra một cửa hàng một cửa cho các startup, doanh nghiệp vừa và nhỏ, và người dùng khoa học để dễ dàng tiếp cận dịch vụ cũng như phát triển kỹ năng và hỗ trợ.

• Các khoản tài trợ sẽ được cung cấp để trang trải chi phí vận hành siêu máy tính và hỗ trợ các hoạt động và dịch vụ của Nhà máy AI.

📌 EU đầu tư 400 triệu euro vào năm 2024 để phát triển "Nhà máy AI", nhằm cạnh tranh toàn cầu trong lĩnh vực AI. Sáng kiến này tập trung vào việc xây dựng siêu máy tính AI và hỗ trợ startup, doanh nghiệp vừa và nhỏ tiếp cận công nghệ AI tiên tiến, với mục tiêu thúc đẩy đổi mới sáng tạo trong nhiều lĩnh vực quan trọng.

https://www.theregister.com/2024/07/30/europe_ai_factories/

Không có file đính kèm.

Nguồn tham khảo

123

AI chips-hardware-compute Semi-Cloud-DC-Green 2024-07-30 23:26:24

AI tạo sinh bùng nổ sẽ thúc đẩy công suất DC khu vực APAC tăng gấp đôi vào năm 2028, đạt 24.800MW

• Theo Moody's, công suất trung tâm dữ liệu ở khu vực Châu Á - Thái Bình Dương (APAC) dự kiến sẽ tăng gấp đôi trong 5 năm tới, từ 10.500MW hiện tại lên 24.800MW vào năm 2028, với tốc độ tăng trưởng kép hàng năm gần 20%.

• APAC được dự báo sẽ chiếm khoảng 30% tổng công suất mở rộng toàn cầu trong 5 năm tới, với hơn 564 tỷ USD đầu tư.

• Sự bùng nổ đầu tư vào phát triển phần mềm AI tạo sinh ở APAC sẽ thúc đẩy tăng trưởng thị trường trung tâm dữ liệu trong khu vực.

• Theo S&P Global, thị phần doanh thu phần mềm AI tạo sinh của APAC dự kiến sẽ tăng từ 14% hiện tại lên 20% vào năm 2028, trong khi Bắc Mỹ giảm từ 63% xuống 55%.

• Hiện có hơn 4.400MW công suất trung tâm dữ liệu đang được xây dựng ở các thị trường chính của APAC, trong đó khoảng 75% ở Trung Quốc, Nhật Bản, Úc và Ấn Độ.

• Tuy nhiên, sự mở rộng trung tâm dữ liệu ở APAC có thể làm tăng rủi ro chuyển đổi carbon và quản lý nước cho các nhà khai thác và nhà đầu tư.

• Hầu hết các quốc gia APAC chủ yếu dựa vào nhiên liệu hóa thạch để phát điện. Trung Quốc, thị trường trung tâm dữ liệu lớn nhất APAC với công suất 3.956MW, phụ thuộc nhiều vào điện than.

• Theo Cơ quan Năng lượng Quốc tế, nhu cầu ngày càng tăng và việc áp dụng AI tạo sinh dự kiến sẽ khiến tiêu thụ điện của trung tâm dữ liệu toàn cầu tăng gấp đôi từ năm 2022 đến 2026.

• Tổ chức phi lợi nhuận China Water Risk cho biết các trung tâm dữ liệu của Trung Quốc tiêu thụ khoảng 1,3 tỷ mét khối nước hàng năm, đủ cho 26 triệu người sử dụng. Con số này có thể đạt hơn 3 tỷ mét khối vào năm 2030.

• Để đáp ứng cam kết khí hậu, các chính phủ APAC đã bắt đầu quản lý tác động môi trường của trung tâm dữ liệu. Trung Quốc vừa công bố kế hoạch hành động về phát triển bền vững trung tâm dữ liệu, đặt mục tiêu cải thiện hiệu quả năng lượng và sử dụng năng lượng tái tạo.

📌 Nhu cầu AI tạo sinh bùng nổ sẽ thúc đẩy công suất trung tâm dữ liệu APAC tăng gấp đôi lên 24.800MW vào năm 2028. Tuy nhiên, việc mở rộng nhanh chóng cũng đặt ra thách thức về tiêu thụ điện và nước, đòi hỏi các giải pháp bền vững hơn trong tương lai.

https://www.scmp.com/business/article/3272205/booming-genai-demand-propel-doubling-asia-pacific-data-centre-capacity-2028

Không có file đính kèm.

Nguồn tham khảo

132

AI chips-hardware-compute 2024-07-30 23:05:21

Trung Quốc tìm cách sử dụng siêu máy tính để phát triển mô hình ngôn ngữ lớn (LLM) nhằm vượt qua lệnh cấm vận chip của Mỹ

• Các chuyên gia cho rằng Trung Quốc cần tìm cách tiếp cận mới để phát triển trí tuệ nhân tạo (AI), thay vì chỉ tăng số lượng bộ xử lý trong trung tâm dữ liệu, do lệnh cấm vận chip của Mỹ.

• Công nghệ siêu máy tính mà Trung Quốc đã phát triển trong thập kỷ qua có thể giúp phá vỡ sự kiểm soát của các hạn chế do Mỹ dẫn đầu đối với ngành AI của Trung Quốc.

• Hệ thống siêu máy tính được thiết kế để huấn luyện mô hình ngôn ngữ lớn (LLM) - công nghệ nền tảng của các dịch vụ AI tạo sinh như ChatGPT - là rất quan trọng để thay thế các cụm máy tính trung tâm dữ liệu tiêu tốn nhiều năng lượng.

• Nỗ lực của Trung Quốc nhằm thiết lập một nền tảng điện toán tiên tiến khả thi để huấn luyện LLM và phát triển ứng dụng AI cho thấy tính cấp thiết của việc tự chủ về công nghệ.

• Tiến bộ AI của Trung Quốc vẫn bị cản trở do lựa chọn GPU hạn chế giữa các lệnh trừng phạt của Mỹ ngăn cản Nvidia cung cấp chip tiên tiến nhất cho nước này.

• Nvidia đang phát triển phiên bản chip AI mới cho thị trường Trung Quốc phù hợp với các quy định kiểm soát xuất khẩu hiện tại của Mỹ.

• Các chuyên gia cho rằng việc xây dựng LLM không chỉ đơn giản là thêm nhiều chip, mà phải học cách giảm tiêu thụ năng lượng và nâng cao hiệu quả như bộ não con người.

• Trung Quốc là thị trường trung tâm dữ liệu lớn nhất khu vực Châu Á - Thái Bình Dương với công suất 3.956 megawatt, phần lớn dựa vào năng lượng than đá.

• Các chuyên gia kêu gọi Trung Quốc tập trung nghiên cứu cơ bản về điện toán thông minh cho LLM, kết hợp với công nghệ tính toán hiệu năng cao (HPC) để đạt được bước đột phá về sức mạnh tính toán.

• Hiện tại, các LLM được phát triển ở Trung Quốc dựa trên mô hình và thuật toán của Mỹ, chưa có đủ cân nhắc về lý thuyết cơ bản.

• Các công ty công nghệ lớn của Trung Quốc như Tencent đang tối ưu hóa cơ sở hạ tầng, bao gồm tăng tốc truyền thông mạng và nâng cao hiệu quả đào tạo AI.

📌 Trung Quốc đang tìm cách sử dụng công nghệ siêu máy tính để phát triển LLM, nhằm vượt qua lệnh cấm chip của Mỹ. Các chuyên gia kêu gọi tập trung vào nghiên cứu cơ bản và kết hợp với HPC để đạt được đột phá.

https://www.scmp.com/tech/tech-war/article/3272354/tech-war-china-eyes-supercomputers-building-llms-amid-us-sanctions-advanced-chips

Không có file đính kèm.

Nguồn tham khảo

119

AI tương lai AI chips-hardware-compute 2024-07-30 22:28:19

CEO của Nvidia, dự đoán tương lai AI sẽ cần 3 máy tính: tạo AI, mô phỏng AI và chạy AI.

• Jensen Huang, CEO của Nvidia, đã có cuộc trò chuyện kéo dài 1 giờ với Wired tại sự kiện Siggraph năm nay về tương lai của AI và các sản phẩm của Nvidia.

• Huang dự đoán rằng trong tương lai, hệ thống AI sẽ cần đến 3 máy tính:
- Một máy để tạo ra AI
- Một máy để mô phỏng và tinh chỉnh AI
- Một máy để chạy AI

• Ông cho rằng thế giới AI đang chuyển từ giai đoạn tiên phong sang "làn sóng doanh nghiệp", và tiếp theo sẽ là "làn sóng vật lý" mà ông mô tả là "thực sự phi thường".

• Huang đề cập đến các sản phẩm của Nvidia phù hợp với 3 máy tính này:
- Máy chủ DGX H100 để tạo AI
- Máy tính nhúng Jetson để mô phỏng AI
- Trạm làm việc và máy chủ sử dụng Omniverse và GPU RTX để chạy AI

• Tuy nhiên, nhiều người cho rằng đây có thể là chiến lược bán hàng của Nvidia, khi hầu hết người dùng và doanh nghiệp không cần đến 3 máy tính phức tạp và đắt đỏ như vậy.

• Siggraph vốn là hội nghị về đồ họa máy tính và công nghệ tương tác, nhưng AI đã trở thành chủ đề chính trong năm nay.

• Huang cũng thừa nhận việc huấn luyện và suy luận AI tiêu tốn rất nhiều năng lượng.

• Nvidia hiện đã chuyển hướng tập trung 100% vào AI, không còn chỉ là công ty đồ họa/game như trước đây.

• Tuy nhiên, game thủ PC vẫn được hưởng lợi từ các tiến bộ AI của Nvidia thông qua công nghệ như RTX và DLSS.

• Một số người cho rằng việc liên tục đẩy mạnh AI vào mọi khía cạnh của đời sống máy tính đang trở nên hơi quá mức.

📌 Nvidia dự đoán tương lai AI cần 3 máy tính riêng biệt, nhưng có thể đây là chiến lược bán hàng. Công ty đang chuyển hướng tập trung hoàn toàn vào AI, với các sản phẩm như DGX H100, Jetson và Omniverse. Tuy nhiên, nhiều người cho rằng việc liên tục đẩy mạnh AI đang trở nên quá mức.

https://www.pcgamer.com/software/ai/nvidias-ceo-chats-about-the-future-of-ai-were-going-to-need-three-computers-one-to-create-the-ai-one-to-simulate-the-ai-and-one-to-run-the-ai/

Không có file đính kèm.

Nguồn tham khảo

146

AI chips-hardware-compute 2024-07-30 07:24:47

Apple sử dụng chip TPU của Google để huấn luyện mô hình AI, thay vì GPU của Nvidia

• Apple tiết lộ trong một báo cáo kỹ thuật rằng họ đã sử dụng chip Tensor Processing Unit (TPU) của Google để huấn luyện các mô hình AI cho hệ thống Apple Intelligence.

• Việc lựa chọn TPU của Google thay vì GPU của Nvidia cho thấy các công ty công nghệ lớn đang tìm kiếm giải pháp thay thế cho Nvidia trong lĩnh vực huấn luyện AI tiên tiến.

• Apple đã thuê các máy chủ đám mây để thực hiện các tính toán huấn luyện AI. Cụ thể, mô hình AFM on-device được huấn luyện trên một "slice" gồm 2.048 chip TPU v5p, trong khi AFM-server được huấn luyện trên 8.192 chip TPU v4.

• TPU v5p là phiên bản TPU tiên tiến nhất của Google, ra mắt vào tháng 12/2023. Chi phí thuê TPU của Google khoảng dưới 2 USD/giờ khi đặt trước 3 năm.

• Nvidia hiện đang thống trị thị trường chip AI cao cấp với GPU của họ. Tuy nhiên, nguồn cung GPU Nvidia khan hiếm do nhu cầu tăng cao từ các công ty như OpenAI, Microsoft, Anthropic.

• Các CEO như Mark Zuckerberg và Sundar Pichai gần đây đã bày tỏ lo ngại về việc đầu tư quá mức vào cơ sở hạ tầng AI, nhưng cho rằng rủi ro kinh doanh khi tụt hậu là quá lớn.

• Apple mới công bố kế hoạch AI của mình muộn hơn so với các đối thủ. Họ vừa giới thiệu hệ thống Apple Intelligence với nhiều tính năng mới như giao diện Siri mới, xử lý ngôn ngữ tự nhiên tốt hơn và tóm tắt bằng AI.

• Trong năm tới, Apple dự định triển khai các chức năng dựa trên AI tạo sinh như tạo hình ảnh, emoji và Siri nâng cao có thể truy cập thông tin cá nhân của người dùng.

• Đây là báo cáo kỹ thuật thứ hai của Apple về hệ thống AI của họ. Báo cáo đầu tiên được công bố vào tháng 6 và cũng đề cập việc sử dụng TPU.

• Apple sẽ công bố kết quả kinh doanh quý vào thứ Năm tuần này.

📌 Apple đã chọn chip TPU của Google thay vì GPU của Nvidia để huấn luyện mô hình AI, sử dụng 2.048 chip TPU v5p cho mô hình on-device và 8.192 chip TPU v4 cho mô hình server. Điều này cho thấy xu hướng tìm kiếm giải pháp thay thế Nvidia trong ngành công nghiệp AI.

https://www.cnbc.com/2024/07/29/apple-says-its-ai-models-were-trained-on-googles-custom-chips-.html

Không có file đính kèm.

Nguồn tham khảo

103

AI chips-hardware-compute 2024-07-30 00:00:57

GPU Nvidia H100 gây thảm họa cho Meta: một sự cố mỗi 3 giờ khi huấn luyện LLama 3

• Meta vừa công bố nghiên cứu về quá trình huấn luyện mô hình Llama 3 405B trên cụm máy chứa 16.384 GPU Nvidia H100 80GB.

• Quá trình huấn luyện kéo dài 54 ngày và gặp 419 sự cố linh kiện không mong muốn, trung bình cứ 3 giờ lại có một sự cố.

• 50% số sự cố là do GPU hoặc bộ nhớ HBM3 trên GPU gây ra.

• Trong 419 sự cố không mong muốn, 148 (30,1%) do các lỗi GPU khác nhau và 72 (17,2%) do lỗi bộ nhớ HBM3.

• GPU Nvidia H100 tiêu thụ khoảng 700W và chịu nhiều áp lực nhiệt, dẫn đến dễ gặp sự cố.

• 41,3% sự cố không mong muốn còn lại do nhiều yếu tố khác như lỗi phần mềm, cáp mạng và bộ chuyển đổi mạng.

• Chỉ có 2 CPU bị hỏng trong 54 ngày huấn luyện.

• Meta đã phát triển các công cụ chẩn đoán riêng và sử dụng PyTorch NCCL flight recorder để nhanh chóng phát hiện và khắc phục sự cố.

• NCCLX đóng vai trò quan trọng trong việc phát hiện và định vị lỗi, đặc biệt là các vấn đề liên quan đến NVLink và RoCE.

• Các công cụ chuyên dụng được sử dụng để xác định GPU chậm trễ, giúp duy trì hiệu quả huấn luyện tổng thể.

• Yếu tố môi trường như biến động nhiệt độ giữa trưa gây ra thay đổi 1-2% về thông lượng.

• Thay đổi đồng thời về mức tiêu thụ điện của hàng chục nghìn GPU tạo áp lực lên lưới điện của trung tâm dữ liệu, đôi khi lên tới hàng chục megawatt.

• Mặc dù gặp nhiều sự cố, nhóm Llama 3 vẫn duy trì thời gian huấn luyện hiệu quả trên 90%.

• So với cụm 16.384 GPU của Meta, cụm 100.000 GPU H100 của xAI có thể gặp sự cố thường xuyên hơn 6 lần.

📌 Meta đối mặt với 419 sự cố trong 54 ngày huấn luyện Llama 3, chủ yếu do GPU H100 và bộ nhớ HBM3. Tuy nhiên, họ vẫn duy trì hiệu suất trên 90% nhờ các công cụ chẩn đoán và tự động hóa tiên tiến. Điều này cho thấy tầm quan trọng của việc quản lý sự cố trong các dự án AI quy mô lớn.

https://www.tomshardware.com/tech-industry/artificial-intelligence/faulty-nvidia-h100-gpus-and-hbm3-memory-caused-half-of-the-failures-during-llama-3-training-one-failure-every-three-hours-for-metas-16384-gpu-training-cluster

Không có file đính kèm.

Nguồn tham khảo

126

AI chips-hardware-compute AI môi trường-năng lượng 2024-07-29 07:42:40

Công nghệ CRAM đột phá loại bỏ mô hình von Neumann, giúp AI tiết kiệm năng lượng gấp 1.000 lần

• Các nhà nghiên cứu từ Đại học Minnesota đã phát triển một chip prototype "bộ nhớ truy cập ngẫu nhiên tính toán" (CRAM) có thể giảm nhu cầu năng lượng cho các ứng dụng AI tới 1.000 lần hoặc hơn so với các phương pháp hiện tại.

• Trong một mô phỏng, công nghệ CRAM cho thấy khả năng tiết kiệm năng lượng lên tới 2.500 lần.

• CRAM hoàn toàn đảo ngược mô hình von Neumann truyền thống bằng cách thực hiện tính toán trực tiếp trong bộ nhớ sử dụng các thiết bị spintronics gọi là magnetic tunnel junctions (MTJs).

• Thay vì dựa vào điện tích để lưu trữ dữ liệu, các thiết bị spintronics tận dụng spin của electron, mang lại giải pháp hiệu quả hơn so với các chip dựa trên transistor truyền thống.

• Bằng cách loại bỏ việc truyền dữ liệu tốn nhiều năng lượng giữa logic và bộ nhớ, công nghệ CRAM có thể đóng vai trò quan trọng trong việc giúp AI tiết kiệm năng lượng hơn rất nhiều.

• Cơ quan Năng lượng Quốc tế dự báo vào tháng 3 rằng mức tiêu thụ điện toàn cầu cho đào tạo và ứng dụng AI có thể tăng hơn gấp đôi từ 460 terawatt-giờ năm 2022 lên hơn 1.000 terawatt-giờ vào năm 2026 - gần bằng mức tiêu thụ của toàn bộ Nhật Bản.

• Nền tảng của đột phá này đã được phát triển trong hơn 20 năm, bắt đầu từ công trình tiên phong của giáo sư kỹ thuật Jian-Ping Wang về việc sử dụng các nanodevice MTJ cho mục đích tính toán.

• Giáo sư Wang thừa nhận rằng các đề xuất ban đầu của họ về việc loại bỏ mô hình von Neumann đã bị coi là "điên rồ" cách đây hai thập kỷ.

• Nhóm nghiên cứu Minnesota đã kiên trì phát triển dựa trên nghiên cứu MTJ được cấp bằng sáng chế của Wang, cho phép sử dụng RAM từ tính (MRAM) hiện đang được sử dụng trong đồng hồ thông minh và các hệ thống nhúng khác.

• Các nhà nghiên cứu vẫn cần giải quyết những thách thức về khả năng mở rộng, sản xuất và tích hợp với silicon hiện có.

• Họ đang lên kế hoạch hợp tác demo với các công ty hàng đầu trong ngành bán dẫn để giúp CRAM trở thành hiện thực thương mại.

📌 Công nghệ CRAM đột phá từ Đại học Minnesota có thể giảm nhu cầu năng lượng cho AI tới 1.000 lần bằng cách tính toán trực tiếp trong bộ nhớ. Dự kiến tiêu thụ điện toàn cầu cho AI sẽ tăng từ 460 lên 1.000 terawatt-giờ vào năm 2026, công nghệ này hứa hẹn mang lại giải pháp tiết kiệm năng lượng đáng kể.

https://www.techspot.com/news/104005-breakthrough-cram-technology-ditches-von-neumann-model-makes.html

Không có file đính kèm.

Nguồn tham khảo

158

AI chips-hardware-compute 2024-07-29 00:22:58

OpenAI đang đàm phán với Broadcom - gã khổng lồ chip trị giá 700 tỷ USD để sản xuất chip có khả năng cạnh tranh với Nvidia

• OpenAI đang đàm phán với Broadcom và một số nhà thiết kế chip khác để phát triển chip AI mới nhằm cạnh tranh với Nvidia.

• Broadcom là công ty thiết kế, phát triển và cung cấp các giải pháp bán dẫn và phần mềm cơ sở hạ tầng, với các sản phẩm được sử dụng trong mạng trung tâm dữ liệu, kết nối gia đình, truy cập băng thông rộng, thiết bị viễn thông, điện thoại thông minh và trạm gốc.

• Hiện Broadcom được xếp hạng là công ty có giá trị lớn thứ 13 trên thế giới, vượt qua các gã khổng lồ công nghệ nổi tiếng hơn như Samsung, AMD, Intel, Arm, IBM và Qualcomm.

• Nvidia gần đây đã trở thành công ty có giá trị lớn thứ 3 trên thế giới, vượt qua Alphabet và Amazon. Vào tháng 6, Nvidia thậm chí còn vượt qua cả Microsoft và Apple trong một thời gian ngắn.

• Microsoft và OpenAI được cho là đang lên kế hoạch cho một dự án trung tâm dữ liệu bao gồm một siêu máy tính AI có tên "Stargate", có thể được trang bị chip của AMD.

• Chưa rõ cuộc đàm phán giữa OpenAI với Broadcom và các đối tác khác có liên quan đến dự án Stargate hay không.

• The Information cho rằng bất kỳ kết quả nào từ những cuộc đàm phán này cũng khó có thể cạnh tranh với sản phẩm hiện tại của Nvidia, do cần nhiều năm nghiên cứu phát triển và đầu tư tài chính.

• OpenAI được cho là đã thuê các cựu nhân viên của Google có kinh nghiệm phát triển bộ xử lý Tensor, cho thấy công ty rất nghiêm túc trong việc phát triển phần cứng riêng.

• Các công ty công nghệ lớn đều muốn tham gia vào lĩnh vực AI nhưng không muốn phụ thuộc vào Nvidia, vì vậy nhiều công ty đang tìm kiếm các giải pháp thay thế.

• Broadcom chuyên về thiết kế, phát triển và cung cấp các giải pháp bán dẫn và phần mềm cơ sở hạ tầng, với sản phẩm được sử dụng rộng rãi trong nhiều lĩnh vực công nghệ.

📌 OpenAI đang đàm phán với Broadcom - công ty chip trị giá 700 tỷ USD lớn hơn cả Intel, AMD, Arm và Qualcomm cộng lại - để phát triển chip AI cạnh tranh với Nvidia. Dù khó vượt qua Nvidia ngay lập tức, động thái này cho thấy tham vọng của OpenAI trong việc giảm phụ thuộc vào các nhà cung cấp chip AI hiện tại.

https://www.techradar.com/pro/openai-is-talking-to-dollar700-billion-chip-giant-youve-never-heard-of-to-produce-chip-capable-of-rivaling-nvidia-broadcom-is-bigger-than-intel-amd-arm-and-qualcomm-together

Không có file đính kèm.

Nguồn tham khảo

114

AI chips-hardware-compute 2024-07-28 23:26:57

Nvidia Blackwell: Máy chủ AI siêu mạnh với giá lên tới 3 triệu USD

• Nvidia dự kiến ra mắt nền tảng Blackwell với các máy chủ AI có giá từ 2-3 triệu USD mỗi tủ.

• Morgan Stanley ước tính Nvidia sẽ xuất xưởng 60.000-70.000 tủ máy chủ B200 trong năm 2025, mang lại doanh thu ít nhất 210 tỷ USD.

• Theo các nhà phân tích HSBC, hệ thống máy chủ GB200 NVL36 của Nvidia sẽ có giá 1,8 triệu USD, trong khi NVL72 sẽ là 3 triệu USD.

• GB200 Superchip kết hợp CPU và GPU dự kiến có giá 60.000-70.000 USD mỗi chip.

• CEO Jensen Huang tiết lộ một GPU Blackwell sẽ có giá từ 30.000-40.000 USD.

• Nvidia đã đầu tư khoảng 10 tỷ USD để phát triển nền tảng Blackwell, với sự tham gia của khoảng 25.000 người.

• B200 có 208 tỷ bóng bán dẫn, cung cấp tới 20 petaflops sức mạnh tính toán FP4.

• Chỉ cần 2.000 GPU Blackwell để huấn luyện mô hình 1,8 nghìn tỷ tham số, tiêu thụ 4 megawatt điện, so với 8.000 GPU Hopper tiêu thụ 15 megawatt cho cùng một tác vụ.

• GB200 Superchip mạnh gấp 30 lần GPU H100 cho các tác vụ suy luận mô hình ngôn ngữ lớn.

• Do nhu cầu cao, Nvidia đang tăng đơn đặt hàng với TSMC lên khoảng 25%.

• Blackwell được thiết kế để cung cấp sức mạnh cho nhiều ứng dụng thế hệ tiếp theo như robot, xe tự lái, mô phỏng kỹ thuật và các sản phẩm chăm sóc sức khỏe.

• Dự kiến Blackwell sẽ trở thành tiêu chuẩn de facto cho huấn luyện AI và nhiều tác vụ suy luận.

• Nhà phân tích David Cahn của Sequoia Capital ước tính doanh thu AI hàng năm cần thiết để bù đắp các khoản đầu tư đã tăng lên 600 tỷ USD.

• Mặc dù chi phí rất cao, nhu cầu về các máy chủ AI mạnh mẽ này vẫn rất lớn từ các công ty công nghệ.

📌 Nvidia dẫn đầu cuộc đua AI với nền tảng Blackwell, dự kiến mang lại 210 tỷ USD doanh thu năm 2025. Máy chủ GB200 NVL72 giá 3 triệu USD, mạnh gấp 30 lần H100, tiết kiệm 73% điện năng khi huấn luyện mô hình 1,8 nghìn tỷ tham số.

https://www.techspot.com/news/103994-nvidia-blackwell-server-cabinets-could-cost-somewhere-around.html

Không có file đính kèm.

Nguồn tham khảo

126

AI chips-hardware-compute 2024-07-26 15:51:46

Accenture và Nvidia hợp tác phát triển AI Refinery - khung làm việc tùy chỉnh mô hình ngôn ngữ lớn Llama 3.1

• Accenture vừa công bố khung làm việc AI Refinery được phát triển trên nền tảng Nvidia AI Foundry. Giải pháp này cho phép khách hàng xây dựng các mô hình ngôn ngữ lớn tùy chỉnh sử dụng mô hình Llama 3.1.

• AI Refinery giúp doanh nghiệp tinh chỉnh và cá nhân hóa các mô hình với dữ liệu và quy trình riêng, tạo ra các giải pháp AI tạo sinh chuyên biệt cho từng lĩnh vực.

• Nền tảng Nvidia AI Foundry cung cấp cơ sở hạ tầng toàn diện để phát triển và triển khai các mô hình AI tùy chỉnh, bao gồm:
- Các mô hình nền tảng từ Nvidia và cộng đồng
- Tài nguyên tính toán DGX Cloud có khả năng mở rộng
- Hỗ trợ chuyên gia từ Nvidia AI Enterprise
- Hệ sinh thái đối tác như Accenture

• AI Refinery Framework của Accenture bao gồm 4 yếu tố chính:
- Tùy chỉnh và đào tạo mô hình theo lĩnh vực
- Nền tảng Switchboard để lựa chọn và kết hợp các mô hình
- Enterprise Cognitive Brain để quét và vector hóa dữ liệu doanh nghiệp
- Kiến trúc agent để hỗ trợ hoạt động AI tự chủ

• Nhiều công ty lớn như Amdocs, Capital One và ServiceNow đã áp dụng AI Foundry vào quy trình làm việc, giúp tạo lợi thế cạnh tranh.

• Nvidia NIM (Nvidia Inference Microservices) cung cấp các lợi thế độc đáo như:
- Mô hình và container tùy chỉnh truy cập qua API tiêu chuẩn
- Chạy trên bất kỳ GPU Nvidia nào trong hơn 100 triệu GPU đã cài đặt
- Hỗ trợ các phiên bản Llama 3.1 khác nhau (8B, 70B, 405B)

• Julie Sweet, CEO của Accenture nhấn mạnh tiềm năng chuyển đổi của AI tạo sinh trong việc tái cấu trúc doanh nghiệp.

• Jensen Huang, CEO của Nvidia cho biết AI Refinery của Accenture sẽ cung cấp chuyên môn và nguồn lực cần thiết để giúp doanh nghiệp tạo ra các mô hình Llama tùy chỉnh.

📌 Accenture và Nvidia hợp tác phát triển AI Refinery trên nền tảng AI Foundry, cho phép doanh nghiệp tùy chỉnh mô hình Llama 3.1 theo nhu cầu riêng. Giải pháp này hứa hẹn thúc đẩy ứng dụng AI tạo sinh trong doanh nghiệp, tạo ra các hệ thống AI chuyên biệt và hiệu quả.

https://siliconangle.com/2024/07/25/nvidia-works-accenture-pioneer-custom-llama-large-language-models/

Không có file đính kèm.

Nguồn tham khảo

127

AI chips-hardware-compute 2024-07-24 21:11:27

Ngành chip đang bị kẹt giữa cuộc chiến AI và địa chính trị

• Ngành công nghiệp bán dẫn đang phải đối mặt với 2 lực đẩy trái chiều: nhu cầu tăng cao từ AI và rủi ro địa chính trị ngày càng lớn.

• ASML, nhà sản xuất thiết bị sản xuất chip hàng đầu của Hà Lan, đang ở tâm điểm của tình thế khó khăn này. Kết quả quý 2 của công ty rất tích cực với doanh số thiết bị đạt 4,8 tỷ euro, trong đó gần một nửa đến từ Trung Quốc. Đơn đặt hàng đạt 5,6 tỷ euro, vượt kỳ vọng của các nhà phân tích.

• Tuy nhiên, cổ phiếu ASML đã giảm hơn 10% vào ngày 24/7 do lo ngại Mỹ có thể áp đặt các hạn chế mới đối với việc bán thiết bị bán dẫn cho Trung Quốc. Điều này cũng kéo theo sự sụt giảm của các cổ phiếu khác trong ngành như Tokyo Electron (-7%) và TSMC (-2%).

• Hiện ASML đã bị cấm xuất khẩu thiết bị tiên tiến nhất sang Trung Quốc, nhưng nước này vẫn chiếm tỷ trọng lớn trong doanh số của công ty. Tỷ lệ này dự kiến sẽ giảm khi nhu cầu ở các khu vực khác tăng lên.

• Mặc dù vậy, triển vọng dài hạn của ASML vẫn tích cực. Công ty dự kiến doanh thu sẽ tăng gấp đôi lên 60 tỷ euro vào năm 2030, chủ yếu nhờ vào các máy lithography tiên tiến không bán cho Trung Quốc.

• Các nhà sản xuất thiết bị ít tiên tiến hơn như Infineon và STMicroelectronics có thể bị ảnh hưởng nhiều hơn do phải đối mặt với sự cạnh tranh gay gắt hơn từ các nhà sản xuất nội địa Trung Quốc.

• Căng thẳng thương mại Mỹ-Trung đang tạo ra những thách thức lớn cho toàn bộ chuỗi cung ứng chip toàn cầu, không chỉ riêng các nhà sản xuất thiết bị cao cấp.

• Bất chấp những lo ngại về địa chính trị, nhu cầu chip vẫn được dự báo sẽ tăng mạnh trong những năm tới nhờ sự phát triển của AI, tự động hóa và số hóa.

• Các nhà đầu tư cần cân nhắc cả yếu tố tăng trưởng dài hạn và rủi ro địa chính trị khi đánh giá triển vọng của ngành bán dẫn.

📌 Ngành chip đang phải cân bằng giữa tiềm năng tăng trưởng từ AI và rủi ro địa chính trị. ASML dự kiến tăng doanh thu lên 60 tỷ euro vào 2030 nhưng đối mặt với nguy cơ hạn chế xuất khẩu sang Trung Quốc. Toàn bộ chuỗi cung ứng chip toàn cầu đang chịu áp lực từ căng thẳng thương mại Mỹ-Trung.

https://www.ft.com/content/a613d44c-6ea4-4689-a125-c4f1861bc22e

#FT

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute AI môi trường-năng lượng 2024-07-24 20:18:15

Supermicro bùng nổ doanh thu nhờ giải pháp làm mát bằng chất lỏng cho AI, tiết kiệm 40% năng lượng

• Supermicro, công ty chuyên về cơ sở hạ tầng AI, đã chứng kiến sự tăng trưởng đáng kinh ngạc với doanh thu tăng 200% so với cùng kỳ năm ngoái trong quý tài chính thứ ba.

• CEO Charles Liang dự đoán "cuộc cách mạng AI có thể lớn hơn cả cuộc cách mạng công nghiệp" và chia sẻ tầm nhìn này tại sự kiện VB Transform 2024.

• Supermicro cung cấp các giải pháp cơ sở hạ tầng AI toàn diện, bao gồm cụm máy chủ và tủ rack được kết nối mạng, làm mát và tích hợp GPU.

• Công ty làm việc chặt chẽ với các nhà lãnh đạo công nghệ như Nvidia, Intel, AMD và Broadcom để phát triển các nền tảng tối ưu nhất cho khách hàng.

• Tại Thung lũng Silicon, Supermicro đang sản xuất và vận chuyển 4.000 tủ rack mỗi tháng, trong đó có 1.000 tủ sử dụng giải pháp làm mát bằng chất lỏng.

• Công ty đang tăng cường sản xuất để đạt mục tiêu 2.000 tủ rack làm mát bằng chất lỏng mỗi tháng.

• Giải pháp làm mát bằng chất lỏng của Supermicro giúp tiết kiệm 30-40% năng lượng so với phương pháp làm mát truyền thống.

• Với cùng một ngân sách điện năng, khách hàng có thể triển khai thêm 30% sức mạnh tính toán khi sử dụng giải pháp làm mát bằng chất lỏng.

• Elon Musk đang sử dụng giải pháp làm mát bằng chất lỏng của Supermicro cho dự án xAI của mình.

• Supermicro đặt mục tiêu làm cho làm mát bằng chất lỏng chiếm ít nhất 20-30% tổng số triển khai trung tâm dữ liệu trong 12 tháng tới.

• Công ty đang chuẩn bị năng lực sản xuất để hỗ trợ toàn bộ ngành công nghiệp AI trên toàn cầu, tin rằng cuộc bùng nổ AI hiện tại mới chỉ ở giai đoạn đầu.

📌 Supermicro đang dẫn đầu cuộc cách mạng AI với doanh thu tăng 200%, nhờ giải pháp làm mát bằng chất lỏng tiết kiệm 40% năng lượng. Công ty đặt mục tiêu sản xuất 2.000 tủ rack làm mát bằng chất lỏng/tháng, chiếm 30% triển khai trung tâm dữ liệu trong năm tới.

https://venturebeat.com/ai/by-embracing-liquid-cooling-ai-powerhouse-supermicro-enables-30-more-computing-power-with-the-same-power-budget/

Không có file đính kèm.

Nguồn tham khảo

134

AI chips-hardware-compute 2024-07-23 07:35:01

Elon Musk công bố xAI đang huấn luyện AI trên cụm máy chủ mạnh nhất thế giới gồm 100.000 GPU H100

• Elon Musk thông báo xAI đã bắt đầu huấn luyện trên "cụm máy chủ huấn luyện AI mạnh nhất thế giới" tại Memphis, Tennessee.

• Cụm máy chủ Memphis được cho là khoản đầu tư vốn lớn nhất của một công ty mới vào thành phố Memphis.

• Dự án chưa có hợp đồng với cơ quan điện lực Tennessee Valley Authority, cần thiết cho các dự án tiêu thụ trên 100 megawatt.

• Cụm máy chủ bao gồm 100.000 GPU H100 của Nvidia được làm mát bằng chất lỏng.

• Hệ thống hoạt động trên một fabric RDMA (Remote Direct Memory Access) duy nhất, giúp truyền dữ liệu hiệu quả và độ trễ thấp giữa các nút tính toán.

• Mục tiêu của xAI là huấn luyện "AI mạnh nhất thế giới theo mọi tiêu chí" vào tháng 12 năm nay.

• Musk tuyên bố cụm máy chủ Memphis sẽ mang lại "lợi thế đáng kể" cho xAI.

• Elon Musk nổi tiếng với việc đưa ra và không đạt được các thời hạn công khai cho nhiều dự án.

• xAI cần một mô hình mới và hữu ích để cạnh tranh với các đối thủ như OpenAI, Anthropic, Google, Microsoft và Meta.

• Microsoft và CEO OpenAI Sam Altman được cho là đang phát triển siêu máy tính huấn luyện AI trị giá 100 tỷ USD có tên mã Stargate.

• xAI cung cấp mô hình ngôn ngữ lớn Grok và chatbot cùng tên thông qua nền tảng X cho người dùng trả phí.

• Các GPU H100 của Nvidia được ra mắt năm ngoái và đang có nhu cầu cao từ các nhà cung cấp mô hình AI.

• Cụm máy chủ Memphis có thể không giữ được danh hiệu mạnh nhất thế giới trong thời gian dài, tùy thuộc vào sự phát triển của dự án Stargate.

📌 Elon Musk tham vọng tạo ra AI mạnh nhất thế giới vào cuối năm 2024 với cụm máy chủ 100.000 GPU H100 tại Memphis. Dù vậy, kế hoạch này phải đối mặt với sự cạnh tranh gay gắt từ các gã khổng lồ công nghệ khác và lịch sử trì hoãn dự án của Musk.

https://venturebeat.com/ai/elon-musk-announces-most-powerful-ai-training-cluster-in-the-world/

Không có file đính kèm.

Nguồn tham khảo

131

AI chips-hardware-compute 2024-07-22 14:03:03

Nvidia phát triển chip AI mới cho Trung Quốc: đối đầu với Huawei và vượt qua rào cản xuất khẩu

• Nvidia đang phát triển phiên bản chip AI cao cấp dành riêng cho thị trường Trung Quốc, tuân thủ các hạn chế xuất khẩu của Mỹ.

• Công ty sẽ hợp tác với Inspur, một trong những nhà phân phối lớn nhất của Nvidia tại Trung Quốc, để phát triển chip mới có tên tạm thời là "B20".

• Các sản phẩm AI hiện tại của Nvidia tại Trung Quốc đã được thiết kế đặc biệt để tuân thủ quy định xuất khẩu của Mỹ. Tuy nhiên, gần đây có thông tin cho rằng các sản phẩm này, như H20, đang gặp phải nhu cầu yếu do cạnh tranh gay gắt từ các nhà sản xuất chip địa phương, đặc biệt là Huawei.

• Vào tháng 3, Nvidia đã giới thiệu dòng chip "Blackwell", dự kiến sẽ đi vào sản xuất vào cuối năm 2024. Dòng chip này được thiết kế đặc biệt để đáp ứng yêu cầu tính toán của các mô hình ngôn ngữ lớn, trong bối cảnh sự quan tâm đến lĩnh vực đang phát triển nhanh chóng này tăng lên đáng kể trong năm qua.

• Sự quan tâm ngày càng tăng đối với phát triển AI đã tạo ra một cơn bùng nổ doanh thu cho Nvidia, thúc đẩy giá trị công ty trở thành một trong những công ty có giá trị nhất trên Phố Wall.

• Nvidia hiện là nhà sản xuất chip có giá trị nhất thế giới.

• Công ty không phản hồi yêu cầu bình luận qua email.

• Cổ phiếu NVDA giảm 2,61% trong phiên giao dịch gần nhất.

• Bài báo cũng đề cập đến việc nhiều nhà đầu tư đang lo ngại về việc đầu tư thêm vào cổ phiếu khi định giá tăng vọt trong năm 2024.

• Investing.com's ProPicks được đề cập như một công cụ để tìm kiếm cơ hội đầu tư mới tiềm năng, với 6 danh mục đầu tư mẫu xác định các cổ phiếu tốt nhất để nhà đầu tư mua ngay bây giờ.

📌 Nvidia đang phát triển chip AI B20 cho thị trường Trung Quốc, hợp tác với Inspur và tuân thủ quy định xuất khẩu Mỹ. Dù đối mặt cạnh tranh từ Huawei, Nvidia vẫn dẫn đầu với dòng chip Blackwell mới và giá trị thị trường cao nhất ngành.

https://ca.investing.com/news/stock-market-news/nvidia-developing-flagship-ai-chip-for-chinese-market-reuters-3507183

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2024-07-19 22:13:45

OpenAI bắt tay Broadcom: cuộc đua chip AI mới nóng bỏng hơn bao giờ hết

• OpenAI đang đàm phán với các nhà thiết kế bán dẫn, trong đó có Broadcom, về việc phát triển một con chip AI mới. Động thái này nhằm giảm sự phụ thuộc vào Nvidia và tăng cường chuỗi cung ứng của công ty.

• Sam Altman, đồng sáng lập và CEO của OpenAI, đang dẫn đầu nỗ lực mở rộng nguồn cung cấp linh kiện và cơ sở hạ tầng cần thiết để vận hành các mô hình AI ngày càng mạnh mẽ hơn.

• Theo một nguồn tin, yếu tố hạn chế của AI là năng lực: năng lực chip, năng lực năng lượng, năng lực tính toán. OpenAI không thể ngồi yên và để người khác xây dựng khi họ đang ở tuyến đầu.

• Altman đã tiếp xúc với các nhà sản xuất chip, đối tác như Microsoft, cơ quan chính phủ và các nhà đầu tư tài chính để tăng cường năng lực và duy trì vị thế trung tâm của công ty trong làn sóng công nghệ AI đang bùng nổ.

• Cuộc đàm phán giữa OpenAI và Broadcom tập trung vào vai trò mà Broadcom có thể đảm nhận trong việc phát triển chip mới cho OpenAI. Tuy nhiên, các cuộc thảo luận vẫn đang ở giai đoạn đầu.

• OpenAI cho biết họ đang có các cuộc trò chuyện liên tục với các bên liên quan trong ngành và chính phủ về việc tăng cường tiếp cận cơ sở hạ tầng cần thiết để đảm bảo lợi ích của AI được phổ biến rộng rãi.

• Các bộ vi xử lý mạnh mẽ là một trong những mặt hàng được săn đón nhất đối với các công ty AI hàng đầu. OpenAI, Microsoft và các đối thủ chính như Anthropic và Google đặc biệt phụ thuộc vào các đơn vị xử lý đồ họa (GPU) tiên tiến của Nvidia để đào tạo và vận hành các mô hình của họ.

• Mặc dù khó có thể cạnh tranh với năng lực công nghệ của Nvidia trong ngắn hạn, OpenAI đang tìm hiểu nhiều cách để trở nên tự chủ hơn trong việc theo đuổi trí tuệ nhân tạo tổng quát (AGI) - AI có thể vượt trội con người trong nhiều nhiệm vụ nhận thức.

• Ngay cả với sự hỗ trợ của Microsoft, đã cam kết 13 tỷ USD, OpenAI vẫn cần hỗ trợ tài chính từ bên ngoài hoặc các đối tác thương mại để hiện thực hóa kế hoạch của mình.

📌 OpenAI đang tích cực tìm kiếm đối tác phát triển chip AI mới, với Broadcom là một ứng cử viên tiềm năng. Mục tiêu là giảm phụ thuộc vào Nvidia, tăng cường chuỗi cung ứng và duy trì vị thế dẫn đầu trong lĩnh vực AI. Dự án này đòi hỏi khoản đầu tư khổng lồ, vượt xa cam kết 13 tỷ USD từ Microsoft.

https://www.ft.com/content/496a0c33-1af3-4dbf-977f-04d6804a8d28

#FT

Không có file đính kèm.

108

AI chips-hardware-compute Semi-Cloud-DC-Green 2024-07-19 22:02:20

Từ đồn điền dầu cọ đến trung tâm AI: bang Johor Malaysia thu hút hàng tỷ đô đầu tư công nghệ

• Bang Johor ở miền nam Malaysia đang trở thành trung tâm dữ liệu và AI mới của khu vực, thu hút hàng tỷ đô la đầu tư từ các công ty công nghệ lớn như TikTok, Nvidia và Microsoft.

• Các công ty đang tận dụng lợi thế đất đai rẻ hơn và nguồn năng lượng dồi dào hơn ở Johor, trong khi vẫn gần Singapore - trung tâm tài chính lớn nhất Đông Nam Á.

• Đầu tư nước ngoài vào Johor đạt 58,8 tỷ ringgit (12,6 tỷ USD) năm 2022 và 31 tỷ ringgit năm 2023, tăng mạnh so với 10 tỷ ringgit năm 2019.

• Giá đất tại Khu công nghệ Sedenak ở Johor đã tăng từ khoảng 40 ringgit/ft2 lên 70-80 ringgit/ft2 trong vài năm qua.

• Malaysia đứng đầu danh sách thị trường trung tâm dữ liệu phát triển nhanh nhất châu Á, với công suất dự kiến tăng 600% trong 5 năm tới.

• YTL Power International đã ký thỏa thuận trị giá 4,3 tỷ USD để xây dựng trung tâm dữ liệu AI ở Johor với Nvidia là khách thuê.

• ByteDance, công ty mẹ của TikTok, dự kiến đầu tư khoảng 10 tỷ ringgit để thành lập trung tâm AI ở Malaysia.

• Johor đang hướng tới việc thiết lập khu kinh tế đặc biệt (SEZ) với Singapore, dự kiến được thống nhất trong năm nay.

• Quốc vương Malaysia hiện tại, vốn là Sultan của Johor, đang thúc đẩy mạnh mẽ sự phát triển kinh tế của bang này.

• Một số lo ngại về việc bùng nổ trung tâm dữ liệu có thể gây áp lực lên tài nguyên mà không tạo ra nhiều việc làm.

• Malaysia vẫn phụ thuộc vào nhiên liệu hóa thạch, bao gồm than đá, cho phần lớn nguồn điện.

• Chính phủ Malaysia muốn có các yêu cầu nghiêm ngặt hơn về sử dụng nước và năng lượng tái tạo trong các trung tâm dữ liệu.

• Johor và Singapore ngày càng hội nhập, với các cửa khẩu biên giới thuộc loại đông đúc nhất toàn cầu.

• Nhiều người hy vọng đầu tư vào Johor sẽ được coi như đầu tư vào Singapore trong tương lai.

📌 Johor, Malaysia đang chuyển mình thành trung tâm AI và dữ liệu hàng đầu Đông Nam Á, thu hút 12,6 tỷ USD đầu tư nước ngoài năm 2022. Với kế hoạch thành lập khu kinh tế đặc biệt cùng Singapore, Johor hứa hẹn trở thành "Thâm Quyến của Đông Nam Á" trong tương lai gần.

https://www.ft.com/content/4d8ab5e8-a7a6-4850-a631-5e9e2a4c13bb

#FT

Không có file đính kèm.

Nguồn tham khảo

133

AI chips-hardware-compute 2024-07-18 07:47:35

CoreWeave CEO khẳng định nhu cầu chip AI của Nvidia là "không ngừng nghỉ"

• Mike Intrator, CEO của startup cơ sở hạ tầng AI CoreWeave, cho biết nhu cầu về chip AI của Nvidia là "không ngừng nghỉ" và nghiêng hẳn về phía Nvidia.

• Thị trường đang trong tình trạng mất cân bằng nghiêm trọng trong 2,5 năm qua và dự kiến sẽ còn tiếp tục như vậy.

• Khách hàng đang đặt hàng trước 9-12 tháng, yêu cầu cung cấp tất cả chip có thể vào một ngày cụ thể.

• Các công ty không có đủ năng lực để đào tạo và triển khai các mô hình AI của họ.

• CoreWeave cung cấp chip từ nhiều nhà sản xuất khác nhau, nhưng khách hàng chỉ muốn công nghệ của Nvidia.

• Intrator nói: "Khách hàng của chúng tôi muốn công nghệ Nvidia. Họ không muốn những thứ khác."

• Ông không thể đánh giá nhu cầu đối với các loại chip khác vì không thể đáp ứng hết nhu cầu về chip Nvidia.

• Trong quý gần nhất, Nvidia đã vượt kỳ vọng về doanh thu và lợi nhuận lần thứ 6 liên tiếp.

• CEO Nvidia Jensen Huang cho rằng cuộc cách mạng công nghiệp mới đã bắt đầu, với các công ty và quốc gia chuyển sang sử dụng điện toán tăng tốc và xây dựng "nhà máy AI".

• Cổ phiếu Nvidia đã tăng khoảng 138% từ đầu năm đến nay nhờ nhu cầu chip AI tiếp tục tăng cao.

• Một số người so sánh tình hình hiện tại với bong bóng dot-com, trong khi những người khác cho rằng AI sẽ tiếp tục thúc đẩy hiệu quả.

• Có ý kiến cho rằng giá cổ phiếu Nvidia mới chỉ bắt đầu tăng.

📌 CoreWeave, startup cung cấp cơ sở hạ tầng AI, báo cáo nhu cầu "không ngừng nghỉ" về chip Nvidia. CEO Mike Intrator nhấn mạnh khách hàng chỉ muốn công nghệ Nvidia, không quan tâm đến các lựa chọn khác. Cổ phiếu Nvidia đã tăng 138% từ đầu năm, phản ánh xu hướng này.

https://www.benzinga.com/news/24/07/39824702/ai-infrastructure-ceo-says-customers-are-showing-relentless-demand-for-nvidia-chips-and-nvidia-chips

Không có file đính kèm.

Nguồn tham khảo

124

AI market AI chips-hardware-compute 2024-07-18 07:43:46

AMD giải thích cách tiếp cận mở để giải quyết tình trạng thiếu hụt GPU và thu hẹp khoảng cách với Nvidia

• Ramine Roane, Phó chủ tịch phụ trách trung tâm dữ liệu, điện toán đám mây và AI của AMD, đã chia sẻ về chiến lược nguồn mở của công ty nhằm thách thức vị thế thống trị của Nvidia trong cuộc chiến chip AI.

• Nvidia hiện đang kiểm soát hơn 70% thị trường chip AI, với nền tảng phần mềm CUDA độc quyền chỉ tương thích với GPU của Nvidia.

• AMD đã chọn hướng đi khác bằng cách phát triển phần mềm ROCm nguồn mở cho lập trình GPU, cho phép mọi người tự do sử dụng, tải xuống và chỉnh sửa.

• Tình trạng thiếu hụt GPU đang là vấn đề lớn trong ngành công nghiệp chip. AMD đang cố gắng sản xuất và cung cấp càng nhiều GPU càng tốt.

• Meta và Microsoft đã công bố kế hoạch mua chip của AMD vào năm ngoái, giảm bớt sự phụ thuộc vào GPU của Nvidia. Microsoft hiện đang triển khai mô hình AI GPT-4 của OpenAI trên phần cứng của AMD.

• Khách hàng đang chuyển đổi các chương trình CUDA sang HIP - ngôn ngữ lập trình của ROCm, có thể tương thích với các GPU khác.

• Theo Alvin Nguyen, chuyên gia phân tích cao cấp tại Forrester, cách tiếp cận nguồn mở của AMD có thể giúp công ty giành được ưu thế trên thị trường và giảm chi phí hỗ trợ.

• Tuy nhiên, việc đảm bảo tương thích với CUDA để cho phép khách hàng chuyển đổi sang các nhà cung cấp GPU khác vẫn sẽ đòi hỏi sự hỗ trợ liên tục từ AMD.

• Thách thức là những thay đổi đối với CUDA có thể tạo ra các vấn đề về tính tương thích, cần thời gian để giải quyết và có thể khiến người dùng các sản phẩm không phải của Nvidia cảm thấy thất vọng.

📌 AMD đang áp dụng chiến lược nguồn mở để thách thức vị thế thống trị 70% thị phần của Nvidia trong lĩnh vực chip AI. Bằng cách phát triển phần mềm ROCm mở, AMD hy vọng giải quyết tình trạng thiếu hụt GPU và thu hút các khách hàng lớn như Meta và Microsoft chuyển từ nền tảng CUDA độc quyền của Nvidia.

https://www.businessinsider.com/amd-ai-vp-gpu-shortage-nvidia-lock-in-2024-7

Không có file đính kèm.

Nguồn tham khảo

114

AI chips-hardware-compute Semi-Cloud-DC-Green 2024-07-17 23:27:15

Cơ sở hạ tầng trung tâm dữ liệu cần "hoàn toàn mới" để đáp ứng nhu cầu AI

- Jacky Liu, Chủ tịch Chief Telecom, cho biết tất cả các khía cạnh của trung tâm dữ liệu sẽ cần nâng cấp đáng kể để đáp ứng yêu cầu của máy chủ AI. Chi phí xây dựng trung tâm dữ liệu mới sẽ cao hơn ít nhất 50% so với trung tâm dữ liệu thông thường.
- Công suất lưới điện tiêu chuẩn cho giá máy chủ trung tâm dữ liệu sẽ tăng từ 4-6 kilowatt lên ít nhất 10 kilowatt, thậm chí lên tới 20 kilowatt cho một số thiết kế đặc biệt.
- Máy chủ AI nặng hơn nhiều, có thể lên tới 1.500 kg và dự kiến đạt 2.000 kg, so với dưới 1.000 kg của máy chủ thông thường. Sàn trung tâm dữ liệu cần được nâng cấp để chịu được trọng lượng nặng hơn, đồng thời cần hệ thống cách chấn động đất và giảm chấn mạnh hơn để bảo vệ.
- Giá của rack máy chủ NV72 mới nhất của Nvidia dành cho tính toán AI vào khoảng 3-4 triệu USD, trong khi máy chủ truyền thống chỉ có giá hàng chục nghìn USD mỗi cái.
- Trung tâm dữ liệu mới nhất của Chief ở Đài Bắc được thiết kế để đáp ứng yêu cầu của máy chủ AI. Công ty này đang mở rộng sang khu vực Đông Nam Á để đáp ứng nhu cầu ngày càng tăng từ các nhà cung cấp Đài Loan đang dịch chuyển chuỗi cung ứng.
- Theo Gartner, chi tiêu cho dịch vụ đám mây công cộng toàn cầu dự kiến tăng 20,4% lên 675,4 tỷ USD trong năm nay và tăng thêm 22,7% trong năm tới nhờ nhu cầu về AI tạo sinh. IDC dự báo tăng trưởng khu vực châu Á - Thái Bình Dương đạt tốc độ kép hàng năm là 17,3% vào năm 2027.

📌 Chief Telecom nhấn mạnh cơ sở hạ tầng trung tâm dữ liệu cần nâng cấp toàn diện để đáp ứng yêu cầu khắt khe của máy chủ AI, với công suất điện tăng gấp đôi, sàn chịu tải nặng hơn và hệ thống chống động đất mạnh mẽ hơn. Công ty đang mở rộng sang Đông Nam Á, nơi chi tiêu đám mây dự kiến tăng trưởng 17,3%/năm đến 2027, để phục vụ các nhà cung cấp Đài Loan đang dịch chuyển chuỗi cung ứng.

https://asia.nikkei.com/Spotlight/Supply-Chain/AI-needs-entirely-new-infrastructure-says-Taiwan-s-Chief-Telecom

Không có file đính kèm.

Nguồn tham khảo

106

AI chips-hardware-compute Semi-Cloud-DC-Green 2024-07-17 20:38:18

Giữa cơn sốt chip AI, tại sao Singapore vẫn đặt cược vào chip truyền thống?

- Giữa cơn sốt toàn cầu về chip AI, Singapore lại tập trung vào sản xuất chip truyền thống (mature-node chips) sử dụng công nghệ từ 28nm trở lên. Những chip này được ứng dụng rộng rãi trong các thiết bị gia dụng, ô tô và máy móc công nghiệp. Ngược lại, chip AI đòi hỏi công nghệ tiên tiến hơn nhiều, từ 7nm trở xuống.
- Hiện tại, chỉ có 3 công ty trên thế giới có khả năng sản xuất chip AI là TSMC (Đài Loan), Samsung (Hàn Quốc) và Intel (Mỹ). TSMC đang thống trị thị trường với 90-95% thị phần. Trong khi đó, Hàn Quốc lại nổi trội ở mảng sản xuất chip nhớ băng thông cao, một thành phần quan trọng để huấn luyện các mô hình AI.
- Singapore không sở hữu bất kỳ cơ sở sản xuất chip tiên tiến nào. Rào cản gia nhập rất lớn do chi phí đầu tư đắt đỏ. Một chiếc máy quang khắc cực tím (EUV) để sản xuất chip dưới 7nm có giá lên tới 180 triệu USD, chưa kể chi phí bảo trì hàng năm. Các nước phát triển lớn như Mỹ và Nhật Bản đang tung ra các gói trợ cấp trị giá hàng tỷ USD để cạnh tranh giành các nhà sản xuất chip hàng đầu như TSMC.
- Tuy nhiên, nhu cầu về chip truyền thống được dự báo sẽ vẫn rất lớn và ổn định trong dài hạn. Bởi lẽ, chúng được ứng dụng trong vô vàn lĩnh vực từ cơ sở dữ liệu, mạng viễn thông, tự động hóa nhà máy, cho tới ô tô thông minh, điện thoại và máy tính xách tay. Sự phát triển của AI cũng sẽ kéo theo nhu cầu tăng cao về năng lực tính toán, lưu trữ và truyền tải dữ liệu.
- Lợi thế của chip truyền thống là có một lượng khách hàng rất đa dạng. Ngoài ra, chúng cũng ít chịu ảnh hưởng từ các căng thẳng địa chính trị vốn đang bao trùm lĩnh vực chip AI.
- Thay vì cố gắng chen chân vào thị trường chip AI, Singapore hoàn toàn có thể tận dụng thế mạnh sẵn có của mình trong lĩnh vực sản xuất chip truyền thống. Đây là lợi thế mà Singapore đã gây dựng từ những năm 1960-1970, khi các tập đoàn bán dẫn lớn bắt đầu đặt chân vào đảo quốc này.
- Hiện nay, nhiều ông lớn như GlobalFoundries, Micron, STMicroelectronics đang vận hành các nhà máy sản xuất chip tại Singapore. Họ có xu hướng mở rộng các cơ sở hiện tại thay vì xây dựng nhà máy mới ở nơi khác, nhằm tiết kiệm thời gian cho việc kiểm định và đáp ứng các tiêu chuẩn của khách hàng.
- Tháng 6/2023, liên doanh giữa NXP Semiconductors và Vanguard International Semiconductor Corp đã công bố kế hoạch đầu tư 7,8 tỷ USD để xây dựng một nhà máy chip tại Singapore. Nhà máy này sẽ sản xuất chip 40-130nm cho thị trường ô tô, công nghiệp, tiêu dùng và di động.
- Bên cạnh đó, số lượng sinh viên tốt nghiệp ngành vi điện tử tại các trường đại học ở Singapore cũng đang tăng lên đáng kể. Chẳng hạn, khoa Thiết kế mạch tích hợp của ĐH Công nghệ Nanyang trước đây chỉ có 25-30 sinh viên tốt nghiệp mỗi năm, nhưng con số này hiện đã lên tới 80 người. Sự quan tâm của giới trẻ một phần đến từ sự chú ý mà ngành bán dẫn nhận được trong đại dịch Covid-19.
- Khi năng lực của ngành bán dẫn Singapore được cải thiện, cơ hội việc làm cũng gia tăng. Các công ty thiết kế chip như AMD đang chuyển nhiều hoạt động thiết kế chip cao cấp sang Singapore, tạo điều kiện cho sinh viên tốt nghiệp thăng tiến. Để thu hút nhân tài, AMD cũng đang trả mức lương cạnh tranh hơn, thu hẹp khoảng cách với thung lũng Silicon.
- Chính sách mở cửa và chào đón nhân tài nước ngoài của Singapore cũng là một lợi thế quan trọng. Bởi không phải tất cả nhân lực cần thiết cho ngành bán dẫn đều có thể được đào tạo trong nước. Những yếu tố như an toàn và việc sử dụng tiếng Anh phổ biến đã giúp Singapore trở thành điểm đến hấp dẫn với nhân tài nước ngoài.
- Kinh nghiệm của Hàn Quốc và Đài Loan cho thấy việc thu hút nhân tài bán dẫn giàu kinh nghiệm từ bên ngoài đóng vai trò quan trọng cho sự phát triển của ngành. Ngược lại, Nhật Bản đã tự hạn chế trao đổi nhân lực từ 30 năm trước, dẫn tới sự chậm lại trong phát triển ngành bán dẫn.

📌 Trong khi nhiều quốc gia đang chạy đua sản xuất chip AI, Singapore vẫn kiên định với lộ trình phát triển chip truyền thống vốn là thế mạnh của mình. Thị trường chip truyền thống có quy mô rất lớn, ổn định và ít bị ảnh hưởng bởi căng thẳng địa chính trị. Với hệ sinh thái bán dẫn đã phát triển qua nhiều thập kỷ, nguồn nhân lực được đào tạo bài bản và chính sách mở cửa với nhân tài nước ngoài, Singapore hoàn toàn có thể tận dụng cơ hội từ nhu cầu chip truyền thống gia tăng do sự bùng nổ của AI. Trong 5 năm tới, Singapore được kỳ vọng sẽ thu hút thêm 10-15 tỷ USD vốn FDI vào lĩnh vực bán dẫn.

https://www.techinasia.com/singapore-losing-out-ai-chip-boom

Is Singapore losing out on the AI chip boom?

Co-written by Sharon See

The global AI boom is spurring some countries to vie for dominance in making leading-edge microchips – but not Singapore.

The city-state’s focus on “mature-node chips” – used in appliances, cars, and industrial equipment – means its semiconductor ecosystem may have limited exposure to the AI boom, says Maybank economist Brian Lee.

Yet industry watchers do not see this as a concern, as the market for mature-node chips is much larger than that for leading-edge ones.

The chips that Singapore makes are for the mass market, says Ang Wee Seng, executive director of the Singapore Semiconductor Industry Association (SSIA).

No appetite for AI chips

AI chips are made to provide high computing power and responsive speed, says Tilly Zhang, a China technology analyst from Gavekal Research.

In contrast to mature-node chips that use so-called “process node” technology of 28 nanometers (nm) or more, cutting-edge AI chips have process nodes of 7 nm or less, and thus require specialized production methods. Current research focuses on developing 2 nm to 3 nm chips.

“That’s something that Singapore will not produce because first and foremost, we don’t have the extreme ultraviolet (EUV) lithography in our fabs here – none of them have that technology,” says Ang, referring to the manufacturing technology for these smaller chips.

Taiwan and South Korea dominate the global AI chip supply as only three companies in the world have the required capability to produce them: Taiwan Semiconductor Manufacturing Company (TSMC), Samsung, and Intel.

Cost is a major hurdle. There is only one maker of EUV lithography machines and its products cost US$180 million each, excluding yearly maintenance costs, according to Trendforce.

The high barrier to entry is why most chips optimized for AI are made by Taiwan-headquartered TSMC, which is considered more mature, advanced, and reliable than Samsung, said Zhang. She estimates TSMC’s market share to be about 90% to 95%.

However, South Korea shines in producing memory chips, including advanced high-bandwidth chips that also require lower process node capabilities and are essential for AI model training.

Singapore, on the other hand, has no advanced chip facilities.

“If other advanced foundries like TSMC or Samsung consider relocating a part of their capacity to Singapore, it could be possible to establish some domestic advanced chip capacity,” Zhang points out.

But with intense competition to woo such chipmakers, industry watchers say that attracting them would be exorbitant.

“More recently, large developed countries like Japan and the US have been dangling very large subsidies in the tune of billions to attract chip production by heavyweights such as TSMC,” Maybank’s Lee points out. “Singapore cannot compete in this subsidies arms race over the longer term.”

Ultimately, companies are the ones making commercial decisions on whether fabs in Singapore should pivot to leading-edge chips, says SSIA’s Ang.

Indirect opportunities

In the “very narrow context” of chip manufacturing, Singapore’s semiconductor industry may not directly benefit from the AI boom, says Ang.

“But if you look at the ecosystem as a whole, from the design, to the packaging and everything else, I think Singapore plays a bigger role than what we actually expect,” he points out.

Ang adds that there is also a trickle-down effect of AI demand: AI requires more computing power, more memory space for databases, and faster connectivity speeds for high-volume data transmission.

The chips that make this possible – by powering databases and communication networks – will continue to be mature-node chips, says Lee Bo Han, partner for R&D and incentives advisory at KPMG in Singapore. In other words, the market for mature-node chips should have ample opportunities and stable demand in the long run.

“Mature-node [chips are] something that we will have to keep using,” he says, citing applications such as factory automation, smart cars, mobile phones, and laptops.

Frederic Neumann, HSBC’s chief Asia economist, agrees that AI chips may not be worth pursuing for Singapore. “Since leading-edge logic chips are hard to manufacture, the technology evolves quickly, and the capital outlays are substantial, it might be worthwhile to focus on other areas of AI-related hardware and software,” he says.

“One opportunity lies in further building on Singapore’s existing expertise in memory chips, including 3D Nand where it holds a roughly 10% global production share,” Neumann adds.

One advantage of mature-node chips is that their wide range of uses means a diversity of clients. Another is that such chips are not affected by the geopolitical tensions surrounding AI-optimized chips.

“If you are in the AI leading-edge technology node, I think you’ll have to be very clear [that your tech] will not end up in China, [as] there is a lot of concern from countries like the US,” says Ang.

Decades of advantage

Instead of trying to go into leading-edge chips, Singapore can hone its established advantage in traditional chips.

This edge has been in the making since the 1960s and 1970s, with the entry of global semiconductor assembly and test operators, also known as “back-end” players.

Now, front-end multinational corporations such as GlobalFoundries, Micron, and STMicroelectronics produce chips that are used in everything from cars to chargers.

As these companies have a strong presence in Singapore, they are more likely to expand their current footprint than build new plants elsewhere, says Ang.

New plants must undergo “qualification,” or ensuring they meet clients’ specifications; expanding an existing plant removes this need and saves time, he notes.

For example, GlobalFoundries took about two years to open the latest expansion of its Fab 7 in Singapore’s Woodlands district. In contrast, TSMC’s second factory in Arizona was announced in 2022, but it may not start production until 2027 or 2028.

Singapore’s continued attractiveness can be seen in the new investments that are still being made.

In June, NXP Semiconductors and TSMC-backed Vanguard International Semiconductor Corp announced a US$7.8 billion joint venture for a Singapore plant that will make 40 to 130 nm chips for the automotive, industrial, consumer, and mobile market segments.

Losing and winning

Though Singapore retains its front-end advantage, its back-end industry has admittedly shrunk. Many such players have moved to cheaper pastures.

When John Nelson joined assembly and test services provider Utac as group chief executive 12 years ago, the company was already moving some of its more manual and technologically dated operations to Thailand.

But instead of leaving entirely, Utac’s Singapore focus has shifted toward research and development.

In September 2020, Utac acquired Powertech Technology Singapore to gain its expertise in a process called wafer bumping. Utac then conducted further engineering R&D to integrate Powertech’s operations post-acquisition.

“You can’t get comfortable, you have to be looking at new things … how can we be successful in each of our operations?” says Nelson.

Even in the mature-node field, innovation is possible. Singapore-based precision manufacturer Jade Micron has seen improvements not just in wafer fabrication, but in areas such as testing. For instance, a single testing machine used to test just two chips at a time, but it can now test up to 32 chips in parallel.

Attracting talent

Singapore’s efforts to maintain its semiconductor edge may be helped by an increasing supply of local talent.

Nanyang Technological University, for instance, has seen rising interest in microelectronics, says SSIA’s Ang. Its integrated circuit design course used to have just 25 to 30 graduates each year, but now has about 80.

He attributes this to the attention that the industry received during the Covid-19 pandemic, when there was a boom in semiconductor demand.

As Singapore’s semiconductor capabilities improve, so do job opportunities. Chip design companies are making higher-end designs here, allowing graduates to move up the value chain.

Such companies include AMD, which acquired high-end chip designer Xilinx in 2022. Together, they have about 1,200 employees in Singapore, including AMD’s chief technology office with some 12 to 15 doctorate holders.

While Singapore does not manufacture AI-related chips, local designers of such chips can expect higher pay, says Steven Fong, AMD’s corporate vice president for Asia Pacific and Japan embedded business.

“The most lucrative, highest paid [engineers] are in Silicon Valley … but we are moving up very fast to narrow the gap with Silicon Valley because of the talent crunch,” he adds.

Singapore’s openness to global talent is also an important edge, says Fong, since not all the required talent for semiconductor R&D can be found locally.

Overseas talent, in turn, are willing to head here, thanks to factors such as the widespread use of English and the country’s relative safety, he points out.

Han Byung Joon, co-founder and CEO of semiconductor startup Silicon Box, notes that Singapore’s openness to foreign talent can help it build a stronger local base.

Markets such as South Korea and Taiwan made great progress partly due to an influx of experienced semiconductor talent, he points out. In contrast, Japan stopped such talent exchanges about 30 years ago and became more self-sufficient, which led development to slow.

“If you have openness and bring in people who are trained and experienced somewhere else … you will be successful. If you close down the country, then you tend to minimize that opportunity,” says Han.

Không có file đính kèm.

Nguồn tham khảo

207

AI chips-hardware-compute 2024-07-17 02:58:05

Startup do sinh viên bỏ học Harvard sáng lập tuyên bố chip AI mới Sohu sẽ cách mạng hóa ChatGPT, nhanh hơn 20 lần so với GPU H100

• Startup Etched do hai sinh viên bỏ học Harvard sáng lập đang phát triển chip AI mới có tên Sohu, nhắm tới thị trường phần cứng AI đang phát triển nhanh chóng.

• Sohu là chip ASIC (Mạch tích hợp chuyên dụng) được thiết kế riêng để chạy các mô hình transformer AI như ChatGPT, Sora và Google Gemini.

• Etched tuyên bố Sohu nhanh hơn 20 lần so với GPU H100 hàng đầu của Nvidia trong việc chạy các mô hình transformer. So với B200 mạnh mẽ hơn của Nvidia, Sohu vẫn nhanh hơn 10 lần.

• Khác với GPU đa năng của Nvidia, Sohu chỉ tập trung vào việc chạy các mô hình transformer AI, không thể chạy các loại mô hình AI khác như mạng nơ-ron tích chập.

• Cách tiếp cận chuyên biệt này có thể mở ra khả năng phát triển các sản phẩm AI mới mà trước đây không thể thực hiện được do giới hạn về sức mạnh tính toán của GPU.

• Ví dụ tiềm năng bao gồm trình dịch đa ngôn ngữ thời gian thực hoặc các ứng dụng đa phương thức tích hợp xử lý ngôn ngữ và hình ảnh.

• Etched đã huy động được 120 triệu USD vào ngày 25/6 để biến Sohu thành hiện thực, nhưng chưa có lộ trình cụ thể cho việc ra mắt sản phẩm.

• Công ty tuyên bố đã nhận được đơn đặt hàng trước trị giá "hàng chục triệu đô la" và đã ký thỏa thuận với TSMC để sản xuất chip 4 nanomet.

• Thành công của Nvidia trong lĩnh vực phần cứng AI đã đưa giá trị vốn hóa thị trường của công ty lên mức 3 nghìn tỷ USD, vượt qua cả Microsoft và Apple vào tháng trước.

• Mặc dù có tiềm năng lớn, hiệu suất và khả năng thực tế của Sohu vẫn chưa được chứng minh và cần phải chờ đợi khi sản phẩm thực sự ra mắt.

📌 Startup Etched tuyên bố chip AI Sohu nhanh hơn 20 lần so với Nvidia H100, huy động 120 triệu USD để phát triển. Chip chuyên biệt cho mô hình transformer có thể mở ra các ứng dụng AI mới, nhưng hiệu suất thực tế vẫn cần được chứng minh.

https://www.ndtv.com/artificial-intelligence/chatgpt-ai-chip-sohu-new-ai-chip-in-making-claims-it-will-revolutionise-chatgpt-6116225

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2024-07-16 18:42:54

Samsung trên bờ vực: đình công lịch sử đe dọa tham vọng chip AI và nguy cơ mất nhân tài về tay đối thủ

• Samsung Electronics đang phải đối mặt với cuộc khủng hoảng lao động ngày càng leo thang, gây trở ngại cho nỗ lực bắt kịp đối thủ trong thị trường bán dẫn dùng cho hệ thống AI.

• Mặc dù lợi nhuận hoạt động quý 2 dự kiến tăng gần 1.500% so với cùng kỳ năm ngoái, Samsung đang gặp khó khăn với tình trạng bất ổn của người lao động và những thất bại trong sản xuất chip.

• Giá cổ phiếu Samsung chỉ tăng khoảng 7,5% trong năm nay, trong khi đối thủ trong nước SK Hynix tăng 65%.

• Samsung đang tụt hậu so với SK Hynix và Micron trong việc phát triển chip bộ nhớ băng thông cao (HBM), một thành phần quan trọng của hệ thống AI. Công ty vẫn chưa vượt qua các bài kiểm tra để trở thành nhà cung cấp HBM cho Nvidia.

• Samsung cũng không thể làm suy yếu vị thế thống trị của TSMC trong lĩnh vực sản xuất chip theo hợp đồng.

• Chủ tịch Lee Jae-yong đã bổ nhiệm Jun Young-hyun làm lãnh đạo mới của bộ phận chip Samsung Electronics, hứa hẹn sẽ "đổi mới bầu không khí nội bộ và bên ngoài" để giải quyết "cuộc khủng hoảng chip".

• Một kỹ sư chip của Samsung tiết lộ rằng bầu không khí nội bộ đang u ám và nhiều người đang cân nhắc rời công ty để gia nhập đối thủ cạnh tranh.

• Khoảng 6.500 thành viên của Công đoàn Samsung Electronics Quốc gia (NSEU) đã bắt đầu một cuộc đình công chưa từng có kéo dài 3 ngày vào tuần trước.

• Samsung cũng đang chịu áp lực nặng nề từ Apple và các đối thủ Trung Quốc giá rẻ trong lĩnh vực di động, trong khi các đối thủ Trung Quốc cũng đang đe dọa thị phần của họ trong lĩnh vực màn hình và thiết bị gia dụng.

• Công đoàn NSEU đã tuyên bố sẽ tiếp tục "đình công vô thời hạn" nhằm vào các dây chuyền sản xuất, bao gồm cả những dây chuyền sản xuất chip HBM.

• Samsung khẳng định vẫn "cam kết tham gia đàm phán thiện chí với công đoàn", nhưng từ chối bình luận về các vấn đề nhân sự.

• Các nhà phân tích cho rằng cuộc đình công sẽ làm phức tạp thêm nỗ lực bù đắp khoảng cách với SK Hynix trong cuộc đua HBM.

• Samsung và SK Hynix đang cạnh tranh quyết liệt để thu hút nguồn nhân lực kỹ thuật hạn chế của Hàn Quốc.

• Samsung vừa công bố một nhóm liên bộ phận chuyên phát triển HBM và cuối cùng sẽ thu hẹp khoảng cách công nghệ với SK Hynix khi ngành công nghiệp chuyển sang các thế hệ chip HBM trong tương lai.

📌 Samsung đang đối mặt với cuộc khủng hoảng lao động nghiêm trọng, ảnh hưởng đến tham vọng chip AI. Công ty tụt hậu so với đối thủ trong phát triển chip HBM và sản xuất chip theo hợp đồng. Cuộc đình công lịch sử của 6.500 công nhân làm trầm trọng thêm tình hình, đe dọa vị thế dẫn đầu của Samsung trong ngành công nghiệp bán dẫn.

https://www.ft.com/content/9b7de6ca-7694-4da4-8d26-e7a6e6079fe1

#FT

Không có file đính kèm.

Nguồn tham khảo

119

AI chips-hardware-compute 2024-07-16 07:46:27

FlashAttention-3: Công nghệ mới tối ưu hóa hiệu suất GPU H100 cho LLM

• FlashAttention-3 là một kỹ thuật mới được phát triển bởi các nhà nghiên cứu từ Colfax Research, Meta, Nvidia, Georgia Tech, Princeton University và Together AI nhằm tăng tốc đáng kể việc tính toán attention trên GPU Nvidia Hopper (H100 và H800).

• Attention là thành phần cốt lõi của kiến trúc transformer được sử dụng trong các mô hình ngôn ngữ lớn (LLM). Tuy nhiên, khi LLM ngày càng lớn hơn và xử lý các chuỗi đầu vào dài hơn, chi phí tính toán attention trở thành nút thắt cổ chai.

• FlashAttention-3 xây dựng dựa trên các công trình trước đó về FlashAttention và FlashAttention-2, tối ưu hóa hơn nữa việc sử dụng tài nguyên trên GPU Nvidia Hopper để tối đa hóa hiệu suất và hiệu quả cho việc huấn luyện và suy luận LLM.

• Kỹ thuật mới này giải quyết thách thức của việc tính toán attention bằng cách giảm số lần đọc và ghi bộ nhớ giữa bộ nhớ băng thông cao (HBM) của GPU và bộ nhớ truy cập ngẫu nhiên tĩnh (SRAM) trên chip GPU khi thực hiện tính toán attention.

• FlashAttention-3 lập lịch các hoạt động để tối đa hóa sự chồng chéo giữa tính toán và di chuyển dữ liệu giữa các phân đoạn bộ nhớ khác nhau của GPU, giảm thời gian GPU chờ đợi dữ liệu được chuyển.

• Kỹ thuật này cũng đan xen các phép nhân ma trận và các phép toán softmax để giảm khả năng xảy ra nút thắt cổ chai trong việc tính toán giá trị attention.

• FlashAttention-3 sử dụng một sắp xếp đặc biệt các phép toán để tính toán attention nhanh hơn và chính xác hơn trong các mô hình lượng tử hóa.

• Theo các nhà nghiên cứu, FlashAttention-3 đạt được mức sử dụng lên tới 75% khả năng tối đa của GPU H100, tương đương với tốc độ tăng 1,5-2 lần so với các phiên bản FlashAttention trước đó cho cả việc huấn luyện và chạy LLM.

• Việc tính toán attention nhanh hơn do FlashAttention-3 cung cấp có thể giúp giảm đáng kể thời gian huấn luyện LLM, mở rộng cửa sổ ngữ cảnh của LLM và giảm số lượng bộ tăng tốc cần thiết để chạy LLM, từ đó giảm chi phí vận hành mô hình trong sản xuất.

• Các nhà nghiên cứu đã mở nguồn FlashAttention-3 dưới giấy phép cho phép và có kế hoạch tích hợp nó vào các thư viện học sâu phổ biến như PyTorch và Hugging Face Transformers.

📌 FlashAttention-3 tối ưu hóa hiệu suất GPU H100 cho LLM, tăng tốc 1,5-2 lần so với phiên bản trước. Công nghệ nguồn mở này giúp giảm thời gian huấn luyện, mở rộng cửa sổ ngữ cảnh lên hàng trăm nghìn token và tiết kiệm chi phí vận hành LLM trong sản xuất.

https://venturebeat.com/ai/flashattention-3-unleashes-the-power-of-h100-gpus-for-llms/

Không có file đính kèm.

Nguồn tham khảo

114

AI chips-hardware-compute 2024-07-13 05:28:00

Úc lắp đặt siêu máy tính mạnh nhất lịch sử phục vụ nghiên cứu AI

- Úc vừa lắp đặt siêu máy tính mạnh nhất từ trước đến nay mang tên Virga, do Tổ chức Nghiên cứu Khoa học và Công nghiệp Khối thịnh vượng chung (CSIRO) phát triển với chi phí 14,5 triệu USD.
- Virga đứng thứ 72 trên bảng xếp hạng Top500 siêu máy tính nhanh nhất thế giới, với 60.000 nhân CPU Intel Xeon thế hệ thứ 4 36 nhân và GPU Nvidia H100 94GB HBM.
- Hiệu năng của Virga đạt gần 15 petaflops, tuy khiêm tốn so với siêu máy tính đứng đầu Frontier (1.200 petaflops) nhưng vẫn là bước tiến lớn so với hệ thống cũ Bracewell và Petrichor 25.000 nhân CPU.
- Virga sử dụng giải pháp làm mát chất lỏng trực tiếp lai, cần tới 50 tấn thiết bị CNTT để lắp đặt, do Dell hợp tác xây dựng.
- Mục tiêu chính của Virga là tăng tốc khám phá khoa học, xử lý bộ dữ liệu lớn, hỗ trợ nghiên cứu trí tuệ nhân tạo như chẩn đoán bệnh qua MRI, phát triển chiến lược robot quốc gia.

📌 Siêu máy tính 14,5 triệu USD Virga với 60.000 nhân CPU, hiệu năng gần 15 petaflops, đứng thứ 72 thế giới, là cỗ máy mạnh nhất lịch sử Úc, mở ra cơ hội đẩy mạnh nghiên cứu AI, robot và giải quyết các bài toán khoa học quy mô lớn.

https://www.extremetech.com/computing/australia-installs-its-most-powerful-supercomputer-yet-for-ai-and-research

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2024-07-10 22:59:49

ByteDance, Alibaba và SenseTime dẫn đầu thị trường dịch vụ hạ tầng AI tạo sinh tại Trung Quốc với hơn 50% thị phần

• ByteDance, Alibaba và SenseTime là 3 nhà cung cấp dịch vụ hạ tầng AI tạo sinh hàng đầu tại Trung Quốc, chiếm hơn 50% thị phần trong nửa cuối năm 2023 theo báo cáo của IDC.

• Các công ty này cho thuê phần mềm, năng lực tính toán, lưu trữ và tài nguyên mạng để doanh nghiệp xây dựng ứng dụng sử dụng mô hình ngôn ngữ lớn (LLM), công nghệ nền tảng của dịch vụ AI tạo sinh như ChatGPT.

• Trung Quốc đã nhanh chóng trở thành quốc gia dẫn đầu thế giới về áp dụng AI tạo sinh kể từ khi OpenAI ra mắt ChatGPT vào tháng 11/2022.

• Theo khảo sát của SAS và Coleman Parkes Research với 1.600 nhà ra quyết định trên toàn cầu, 83% người được hỏi ở Trung Quốc cho biết đã sử dụng AI tạo sinh, cao hơn nhiều so với mức trung bình toàn cầu 54% và Mỹ 65%.

• Thị trường điện toán thông minh tại Trung Quốc, bao gồm cả AI tạo sinh và phi AI tạo sinh, đã tăng trưởng gần 86% đạt 11,4 tỷ nhân dân tệ (1,6 tỷ USD) trong nửa cuối 2023, với các nhà cung cấp dịch vụ hạ tầng AI tạo sinh đóng góp gần 60% tăng trưởng.

• Bắc Kinh đang tìm cách nâng tỷ trọng năng lực tính toán AI của Trung Quốc lên 35% vào cuối năm 2025, từ mức 25,4% giữa năm 2023.

• Trung Quốc hiện đứng thứ hai sau Mỹ về tổng năng lực tính toán, nhưng vẫn còn lo ngại về thị trường phân mảnh, thiếu chip cho phát triển AI và khó khăn trong xây dựng năng lực tính toán nội địa do hạn chế xuất khẩu bán dẫn tiên tiến của Mỹ.

• Trung Quốc đang xây dựng 8 trung tâm tính toán quốc gia và 10 cụm trung tâm dữ liệu quốc gia trong dự án "Dữ liệu phía Đông và Tính toán phía Tây", dự kiến thu hút khoảng 400 tỷ nhân dân tệ đầu tư mỗi năm.

• Trước khi ChatGPT phổ biến cuối năm 2022, một số công ty công nghệ Trung Quốc đã mất hứng thú với AI và cân nhắc trả lại đơn đặt hàng chip A100 tiên tiến của Nvidia. ByteDance vẫn "lạc quan về AI" và đã mua lại những con chip này, hiện đang rất được săn đón tại Trung Quốc.

📌 Trung Quốc dẫn đầu thế giới về áp dụng AI tạo sinh với 83% doanh nghiệp đã triển khai, cao hơn nhiều so với mức trung bình toàn cầu 54%. ByteDance, Alibaba và SenseTime chiếm hơn 50% thị phần dịch vụ hạ tầng AI tạo sinh tại Trung Quốc. Thị trường điện toán thông minh đạt 11,4 tỷ nhân dân tệ, tăng 86% trong nửa cuối 2023.

https://www.scmp.com/tech/big-tech/article/3269939/bytedance-alibaba-sensetime-lead-generative-ai-infrastructure-services-market-china

Không có file đính kèm.

Nguồn tham khảo

145

AI chips-hardware-compute 2024-07-09 23:33:21

Tencent nâng cấp mạng Xingmai 2.0: tăng 60% hiệu suất truyền thông mạng, hỗ trợ 100.000 GPU cho đào tạo AI

• Tencent Holdings đã nâng cấp đáng kể mạng máy tính hiệu năng cao Xingmai 2.0, tăng cường khả năng AI và cải thiện hiệu quả đào tạo mô hình ngôn ngữ lớn (LLM).

• Mạng Xingmai 2.0 mới có thể hỗ trợ hơn 100.000 GPU trong một cụm tính toán duy nhất, gấp đôi công suất so với mạng ban đầu ra mắt năm 2023.

• Hiệu suất truyền thông mạng tăng 60% và hiệu quả đào tạo LLM tăng 20% nhờ việc tối ưu hóa cơ sở hạ tầng hiện có.

• Tencent đạt được những cải tiến này mà không cần đầu tư vào bộ xử lý mới, vốn khó có thể tiếp cận do quy định xuất khẩu của Mỹ.

• Công ty đang thúc đẩy việc sử dụng LLM độc quyền trong các ứng dụng doanh nghiệp và cung cấp dịch vụ hỗ trợ các doanh nghiệp khác phát triển mô hình AI riêng.

• Ngành công nghiệp AI Trung Quốc đang trong cuộc chiến giá cả, với các công ty lớn như Alibaba, Baidu và ByteDance đua nhau giảm giá để thúc đẩy công nghệ AI của họ.

• Tencent đã cung cấp miễn phí phiên bản lite của LLM Hunyuan và giảm giá cho các phiên bản tiêu chuẩn nhằm tăng cường áp dụng thương mại.

• Baidu báo cáo hiệu quả đào tạo LLM Ernie tăng gấp 5 lần và chi phí suy luận giảm 99%, cho thấy nỗ lực của các công ty công nghệ Trung Quốc trong việc nâng cao hiệu quả và giảm chi phí đào tạo AI.

• Những tiến bộ này rất quan trọng trong bối cảnh cuộc chiến giá cả, giúp công nghệ AI trở nên dễ tiếp cận và giá cả phải chăng hơn.

• Các công ty công nghệ Trung Quốc đang tận dụng cải tiến hiệu quả thay vì dựa vào bộ xử lý tiên tiến để cạnh tranh với các đối thủ phương Tây.

📌 Tencent nâng cấp mạng Xingmai 2.0 hỗ trợ 100.000 GPU, tăng 60% hiệu suất truyền thông và 20% hiệu quả đào tạo LLM. Động thái này phản ánh nỗ lực của Trung Quốc trong việc tăng cường khả năng AI bằng cách tối ưu hóa tài nguyên sẵn có, đối phó với hạn chế tiếp cận chip tiên tiến.

https://www.tomshardware.com/tech-industry/artificial-intelligence/tencent-boosts-100000-gpu-capable-hpc-clusters-with-network-optimization

Không có file đính kèm.

Nguồn tham khảo

118

AI chips-hardware-compute Semi-Cloud-DC-Green 2024-07-08 15:14:49

Singapore đang chuyển hướng ngành trung tâm dữ liệu sang tập trung vào AI

• Singapore đang đối mặt với tình trạng thiếu hụt công suất trung tâm dữ liệu, điều này có thể thúc đẩy ngành hướng tới các ứng dụng AI có giá trị cao hơn.

• Kiran Karunakaran từ Bain & Company dự đoán Singapore sẽ dẫn đầu khu vực trong việc chuyển đổi công suất trung tâm dữ liệu hiện có thành cơ sở hỗ trợ AI.

• Ước tính các công ty điện toán đám mây lớn như Google và Amazon chiếm 70% lưu lượng sử dụng trung tâm dữ liệu ở Singapore. Họ có thể tận dụng sự hiện diện tại đây cho các khối lượng công việc AI, đồng thời chuyển các khối lượng công việc truyền thống sang Malaysia và Indonesia.

• Singapore đã công bố sẽ cung cấp thêm ít nhất 300 megawatt (MW) công suất cho trung tâm dữ liệu trong ngắn hạn. Thêm 200 MW có thể được cấp cho các nhà khai thác sử dụng năng lượng xanh.

• Hiện tại, Singapore có hơn 70 trung tâm dữ liệu với tổng công suất 1,4 gigawatt.

• Niccolo Lombatti từ BMI Technology cho rằng Singapore sẽ không đủ công suất để đào tạo các mô hình AI lớn, và 300 MW bổ sung có thể được sử dụng tốt hơn cho suy luận AI.

• Kết nối của Singapore là một yếu tố hỗ trợ sự phát triển của AI trong nước. Serene Nah từ Digital Realty tin rằng Singapore có thể giữ lại các khối lượng công việc quan trọng và duy trì vị thế là trung tâm kết nối chính trong khu vực.

• Ngành trung tâm dữ liệu Singapore đang đối mặt với thách thức lưu trữ khối lượng công việc AI. Singtel đang loại bỏ các trung tâm dữ liệu cũ kém hiệu quả và xây dựng các cơ sở bền vững hơn.

• Dự án Tuas 58 MW của Singtel sẽ tăng gấp đôi công suất hoạt động của công ty tại Singapore lên 120 MW khi hoàn thành vào cuối năm 2025, với hiệu quả sử dụng năng lượng (PUE) dự kiến là 1,23.

• Các công nghệ mới như làm mát bằng chất lỏng đang được triển khai để tăng hiệu quả làm mát cho khối lượng công việc AI tiêu thụ nhiều năng lượng hơn.

• Oliver Curtis từ Sustainable Metal Cloud cho biết các máy chủ hỗ trợ AI có thể tiết kiệm năng lượng hơn các máy chủ truyền thống, cho phép Singapore tạo ra nhiều đầu ra hơn với cùng một lượng công suất.

• Cạnh tranh từ các nước trong khu vực như Malaysia và Indonesia đang gia tăng, nhưng Singapore vẫn có lợi thế về sự chắc chắn trong quy định và môi trường kinh doanh.

• Princeton Digital Group đang thực hiện chiến lược SG+ từ năm 2023, xây dựng các khuôn viên trung tâm dữ liệu ở Singapore, Batam và Johor Bahru hợp tác với Ủy ban Phát triển Kinh tế Singapore.

📌 Singapore đang chuyển hướng ngành trung tâm dữ liệu sang tập trung vào AI để đối phó với tình trạng thiếu hụt công suất. Với 70 trung tâm dữ liệu hiện có và kế hoạch bổ sung 300-500 MW, quốc đảo này đang đầu tư vào công nghệ làm mát tiên tiến và năng lượng xanh để duy trì vị thế dẫn đầu khu vực, đồng thời đối mặt với cạnh tranh từ Malaysia và Indonesia.

https://www.techinasia.com/singapores-data-center-crunch-drive-sector-ai-focus

#techinasia

Singapore’s data center crunch could drive sector’s AI focus

The limited capacity in the data center sector is likely to push the local data center industry toward higher-value AI use cases.

Kiran Karunakaran, partner at Bain & Company, expects the city-state to take the lead in the region to convert existing data center capacity to AI-enabled facilities.

He estimates that firms operating large-scale cloud platforms, such as Google and Amazon, account for 70% of data center usage in the country. These companies will likely leverage their presence in Singapore for AI workloads while shifting more traditional workloads to Malaysia and Indonesia.

“Many of the data centers in Singapore have already started thinking about AI workloads, says Karunakaran. He adds that in terms of readiness, they are “already ahead” when it comes to availability of graphics processing units – semiconductor chips used to train and run AI models – as well as conversion of existing Tier 4 data centers to AI-enabled ones.

Even with Singapore’s move to increase allocated capacity to the industry, the sector still faces energy and water constraints. In May, Singapore said that it will provide at least 300 megawatts (MW) of additional capacity for data centers in the near term.

Janil Puthucheary, the country’s senior minister of state for communications and information, said in a speech in May that another 200 MW or more could be made available to operators who tap green energy.

Singapore currently has more than 70 data centers, which have a total of 1.4 gigawatts of capacity.

Even with the expected shift toward AI-enabled facilities, Niccolo Lombatti, media and telecoms analyst at BMI technology, says that the types of AI workloads executed in Singapore also matters.

Currently, there is a lot of focus on training and improving AI models, such as OpenAI’s ChatGPT and AI Singapore’s Sea-Lion large language model. But Lombatti says that the nation will not have sufficient capacity to train such models, noting that the average data center development in the US already takes up 200 MW.

“I think that the 300 MW may be better used – and I think that will be the plan – in AI inference, which requires less power density but requires being much closer to the user,” he adds.

AI inference refers to the process in which AI models generate their own results after being trained on data sets. For instance, AI inference for autonomous driving could be done locally in Singapore for optimal performance and safety.

Another factor supporting the growth of AI in the country is its connectivity, according to Serene Nah, managing director and head of Asia Pacific at Digital Realty. She believes that Singapore can retain critical workloads, and remain a key connectivity hub in the region by providing a range of connectivity options.

“Singapore’s world-class connectivity makes it a prime location for deploying cutting-edge AI. Co-locating AI with global networks in Singapore allows for seamless data processing across vast distances and access to a wide range of customers,” Nah explains.

She adds that there are several ongoing initiatives to import renewable energy and develop low-carbon energy technologies locally.

Local readiness for AI

Singapore’s data center industry is taking on the challenge of hosting these AI workloads.

Bill Chang, CEO of Singtel’s data center arm Nxera, says that the telco is phasing out its older, less efficient data centers and building more sustainable facilities in their place.

“This involves building highly efficient data centers that optimize land, power, and water use through advanced technologies, such as liquid cooling and smart operations, to achieve better overall energy efficiency and operational resiliency, and making a complete switch to renewable energy from the grid for our internal operations and common utilities,” he explains.

Singtel’s 58 MW Tuas project will double the company’s operational capacity in Singapore to 120 MW when it is completed in end-2025.

The project is expected to have a power usage effectiveness (PUE) of 1.23. This metric refers to the ratio of energy used for cooling on top of the IT load, and a ratio of one indicates no additional energy used for cooling.

But with the shift toward AI, these workloads will consume more power. Experts note that there are new technologies in place to boost cooling efficiency.

In its roadmap outlining Singapore’s green initiatives for data centers, the Infocomm Media Development Authority (IMDA) noted that AI workloads will have higher rack densities, which refer to the amount of power used by a single rack cabinet in a data center. While the average server rack consumed 8.4 kilowatts (kW) in 2020, this could rise to over 100 kW per rack.

Air cooling – where servers are placed in air-conditioned rooms – can only support up to 20 kW per rack. Hence, more sophisticated liquid cooling solutions will be necessary to effectively cool higher-density racks.

Oliver Curtis, co-founder of AI cloud service provider Sustainable Metal Cloud, says that AI-enabled servers could be more power-efficient than traditional servers. This would enable Singapore to produce more output for the same amount of power capacity that it currently has.

The company has retrofitted existing data center capacity from ST Telemedia Global Data Centres to host AI servers that are immersed in thermally conductive liquid that removes heat more efficiently than air. This improves the firm’s PUE from 1.5 to 1.1, well below IMDA’s threshold of 1.3 for what is considered a “green” data center.

“That allows us to price our product as cheap as in the US, yet we’re doing so here in a much more high-cost environment,” Curtis adds.

Given energy constraints and the need to be sustainable, NTT Data Singapore CEO Png Kim Meng says that if there were an update to IMDA’s roadmap, he would like to see a deeper integration of green initiatives and advanced technologies such as AI.

“Enhancements should focus on expanding the scope of sustainable development practices within data centers, promoting energy efficiency, and reducing carbon footprints,” he said, adding that robust incentives and clear guidelines will incentivize more companies to invest in green technologies.

Competition from the region

BMI’s Lombatti said that because energy and power are scarce resources in Singapore, companies have looked to Malaysia’s Johor Bahru and Indonesia’s Batam to deploy capital, even if these markets are not as digitally mature.

Still, he noted that there is a broader risk that the explosive growth in these markets could lead to resource constraints as well.

Noorazam Osman, Johor Bahru’s city council mayor, said in May that data center investments should not compromise the state’s domestic water and power needs.

Lombatti says that regulators and governments may later realize the scale of the water and energy drained by data centers after they are built, only to implement regulations that create uncertainty for operators.

“They will likely introduce either a local ban, perhaps in a town or a specific region, or it can be a countrywide ban, where there is no more building activity,” he adds.

Bain’s Karunakaran points out that one factor in Singapore’s favor is that the regime offers businesses certainty. This likely contributes to the 20% premium that local data centers tend to draw.

He noted that data center operators in Indonesia have faced foreign ownership limits, along with significant currency risks and some potential difficulties in repatriating profits back to shareholders as dividends.

While the proportion of Southeast Asian data center capacity hosted in Singapore may fall, he does not expect the proportion of revenue generated by the country’s data centers compared to their regional counterparts to decline in the next three years.

Asher Ling, managing director of Singapore-based data center operator Princeton Digital Group, notes that IMDA’s roadmap helps to establish the guard rails for companies seeking new data center capacity.

Princeton Digital Group has been executing its SG+ strategy since 2023, to build data center campuses in Singapore, Batam, and Johor Bahru in collaboration with the Singapore Economic Development Board.

“We’re able to work collaboratively, symbiotically with Johor and Batam to create a larger region that really serves all the complex needs of the global community,” Ling says. “I think that really becomes a very interesting case study for the world to see in the next five years or so.”

Không có file đính kèm.

Nguồn tham khảo

166

AI chips-hardware-compute 2024-07-08 11:33:33

Innatera và cuộc cách mạng âm thầm trong phần cứng AI với chip thần kinh học

- Chip thần kinh học của Innatera được thiết kế để mô phỏng cách não sinh học xử lý thông tin, sử dụng mạng lưới các nơ-ron nhân tạo giao tiếp qua xung điện, tương tự như nơ-ron thật.
- Kiến trúc lấy cảm hứng từ não này mang lại nhiều lợi thế cho hệ thống thần kinh học, đặc biệt trong các ứng dụng điện toán biên như thiết bị tiêu dùng và IoT công nghiệp.
- Bộ xử lý thần kinh học có thể thực hiện các tác vụ AI phức tạp chỉ với một phần nhỏ năng lượng so với các giải pháp truyền thống, cho phép các khả năng như nhận thức môi trường liên tục trên thiết bị chạy pin.
- Sản phẩm chủ lực của Innatera, Bộ xử lý thần kinh xung T1, kết hợp công cụ tính toán theo sự kiện với bộ tăng tốc CNN thông thường và CPU RISC-V, tạo nên một nền tảng toàn diện cho AI siêu tiết kiệm năng lượng trên thiết bị pin.
- Giải pháp thần kinh học của Innatera có thể thực hiện tính toán với năng lượng ít hơn 500 lần so với cách tiếp cận thông thường và tốc độ nhận dạng mẫu nhanh hơn khoảng 100 lần so với đối thủ.
- Innatera hợp tác với Socionext phát triển giải pháp sáng tạo cho phát hiện sự hiện diện của con người, kết hợp cảm biến radar với chip thần kinh học để tạo ra thiết bị hiệu quả cao, bảo vệ quyền riêng tư.
- Công nghệ này có ứng dụng rộng rãi như tự động hóa nhà thông minh, an ninh tòa nhà và phát hiện người ở trên xe, mang đến khả năng AI cho thiết bị biên đồng thời giảm tiêu thụ năng lượng và nâng cao quyền riêng tư.
- Innatera đang tăng cường sản xuất, Bộ xử lý thần kinh xung dự kiến sẽ đi vào sản xuất cuối năm 2024 với lô hàng lớn bắt đầu từ Q2/2025.
- Công ty gần đây đã huy động 21 triệu USD trong vòng Series A để đẩy nhanh phát triển bộ xử lý thần kinh xung.
- Innatera đã xây dựng bộ công cụ phát triển phần mềm (SDK) rất mở rộng, sử dụng PyTorch làm giao diện, cho phép các nhà phát triển ứng dụng dễ dàng hướng đến chip của họ.

📌 Chip thần kinh học tạo của Innatera hứa hẹn cách mạng hóa điện toán AI với hiệu quả cao gấp 500 lần, tốc độ nhanh gấp 100 lần so với giải pháp thông thường. Công ty đang hướng tới thị trường ứng dụng cảm biến biên với mục tiêu đưa trí tuệ đến 1 tỷ thiết bị vào năm 2030, mở ra kỷ nguyên mới cho AI thông minh và bền vững hơn.

https://venturebeat.com/ai/beyond-gpus-innatera-and-the-quiet-uprising-in-ai-hardware/

Không có file đính kèm.

Nguồn tham khảo

128

AI chips-hardware-compute 2024-07-08 10:51:10

Trung tâm dữ liệu AI "Gigafactory" của Elon Musk sẽ có 350.000 GPU của Nvidia và sẽ hoạt động trong vài tháng tới

- Trung tâm dữ liệu AI mới của Elon Musk tại nhà máy Tesla Gigafactory ở Texas sử dụng công nghệ làm mát bằng chất lỏng của Supermicro. CEO của Supermicro, Charles Liang, đánh giá cao giải pháp này.

- Liang ước tính việc Musk dẫn đầu xu hướng sử dụng làm mát bằng chất lỏng cho các trung tâm dữ liệu AI lớn có thể giúp bảo tồn 20 tỷ cây xanh trên hành tinh. Supermicro tuyên bố công nghệ làm mát trực tiếp bằng chất lỏng có thể giảm tới 89% chi phí điện năng so với làm mát bằng không khí.

- Mục tiêu của Supermicro là tăng tỷ lệ áp dụng làm mát trực tiếp bằng chất lỏng từ dưới 1% lên trên 30% trong một năm.

- Trung tâm dữ liệu mới của Tesla sẽ chứa 50.000 GPU Nvidia và phần cứng AI của Tesla để huấn luyện tính năng lái tự động hoàn toàn. Musk ước tính cụm siêu máy tính này sẽ tiêu thụ 130 megawatt khi triển khai và tăng lên 500 megawatt sau khi cài đặt phần cứng AI độc quyền của Tesla.

- Ngoài ra, Elon Musk cũng đang xây dựng một cụm siêu máy tính khác cho công ty xAI, sử dụng 100.000 GPU H100 của Nvidia và dự kiến nâng cấp lên 300.000 GPU B200 vào mùa hè năm sau. Cụm này cũng sẽ được làm mát bằng chất lỏng bởi Supermicro.

- Cả hai cụm siêu máy tính dự kiến sẽ đi vào hoạt động trong vài tháng tới. Tuy nhiên, việc xây dựng cụm của Tesla có thể bị trì hoãn vài tháng do Musk yêu cầu Nvidia chuyển hàng nghìn GPU đặt cho Tesla sang cho xAI.

📌 Elon Musk đang xây dựng hai trong số các cụm siêu máy tính AI lớn nhất thế giới, sử dụng tổng cộng 350.000 GPU Nvidia, áp dụng công nghệ làm mát bằng chất lỏng tiên tiến của Supermicro. Dự án này hứa hẹn thúc đẩy xu hướng làm mát bằng chất lỏng, giúp tiết kiệm năng lượng đáng kể cho các trung tâm dữ liệu AI trong tương lai.

https://www.tomshardware.com/tech-industry/artificial-intelligence/elon-musks-liquid-cooled-gigafactory-data-centers-get-a-plug-from-supermicro-ceo-tesla-and-xais-new-supercomputers-will-have-350000-nvidia-gpus-both-will-be-online-within-months

Không có file đính kèm.

Nguồn tham khảo

135

AI chính phủ AI chips-hardware-compute 2024-07-06 17:12:52

Ấn Độ chi 50% ngân sách "Sứ mệnh AI quốc gia" để mua GPU hỗ trợ startup trong nước

- Chính phủ Ấn Độ sẽ chi khoảng 5.000 crore rupee (tương đương 607 triệu USD), trong tổng số 10.372 crore rupee (1,26 tỷ USD) của Sứ mệnh AI Ấn Độ để mua sắm GPU và cung cấp năng lực tính toán được trợ giá cho các công ty khởi nghiệp Ấn Độ.
- GPU là chip chuyên dụng được tối ưu hóa để tăng tốc các tác vụ trí tuệ nhân tạo (AI) và học máy thông qua xử lý nhanh hơn. Nvidia, Intel và AMD là những nhà sản xuất GPU lớn nhất thế giới.
- Chính phủ đang trong quá trình đấu thầu để mua chip nhưng sẽ không mua trực tiếp. Thay vào đó, họ sẽ muốn các công ty tư nhân đầu tư và chính phủ sẽ trợ giá một phần chi phí truy cập vào năng lực tính toán đó.
- Cách tiếp cận này cho phép người dùng, doanh nghiệp và công ty khởi nghiệp quyết định loại GPU phù hợp với nhu cầu sử dụng của họ.
- Chính phủ sẽ chỉ thực hiện một số kiểm tra và cân bằng để đảm bảo không bị lạm dụng, ví dụ như người dùng nhận được tính toán được trợ giá nhưng lại chuyển cho người khác.
- Trước đó, Bộ trưởng Bộ Điện tử và Công nghệ Thông tin Ấn Độ (MeitY) cho biết chính phủ đang xem xét cách tiếp cận tài trợ khoảng cách khả thi hoặc cơ chế dựa trên phiếu mua hàng cho lĩnh vực AI để GPU sẵn có nhanh hơn và rộng rãi hơn.

📌 Ấn Độ sẽ đầu tư 5.000 crore rupee (khoảng 607 triệu USD) từ ngân sách Sứ mệnh AI quốc gia để mua hơn 10.000 GPU, nhằm hỗ trợ các công ty khởi nghiệp AI trong nước bằng cách trợ giá chi phí tính toán. Cách tiếp cận này cho phép doanh nghiệp tự quyết định loại GPU phù hợp và chính phủ sẽ giám sát để tránh lạm dụng.

https://www.business-standard.com/technology/tech-news/govt-to-use-50-of-india-ai-mission-funds-for-gpu-procurement-meity-124070400728_1.html

Không có file đính kèm.

Nguồn tham khảo

193

AI chips-hardware-compute 2024-07-06 08:57:20

Siêu máy tính với 1 triệu chip NVIDIA và AMD sắp ra đời

• Trong một cuộc phỏng vấn với The Next Platform, Giám đốc điều hành Trung tâm dữ liệu của AMD, Forrest Norrod, đã tiết lộ rằng có khách hàng đang thảo luận về trung tâm dữ liệu có tới 1 triệu bộ xử lý chỉ trong một máy.

• Với giá khoảng 25.000 USD cho một GPU cao cấp, những siêu máy tính này có thể có giá trị lên tới 25 tỷ USD chỉ riêng phần GPU, chưa kể các chi phí khác như mạng, bộ nhớ và máy chủ.

• Broadcom cũng đề cập đến các cụm AI tiên tiến đang được thảo luận với quy mô từ khoảng 4.000 bộ xử lý lên tới 1 triệu.

• Xu hướng này xuất phát từ mối quan hệ gần như tuyến tính giữa kích thước dữ liệu đưa vào mô hình và chất lượng của mô hình AI. Hiện tại, cần nhiều dữ liệu hơn và nhiều chip máy tính hơn (đặc biệt là GPU và các chip tùy chỉnh khác) để đẩy mạnh AI.

• Độ phức tạp của các mô hình AI tiên tiến đang tăng nhanh chóng. ChatGPT đầu tiên có khoảng 117 triệu tham số, trong khi ChatGPT 5 (phiên bản tiếp theo) dự kiến sẽ có khoảng 17,5 nghìn tỷ tham số.

• Phần lớn các "siêu máy tính" này vẫn đang trong giai đoạn lên ý tưởng. Microsoft được đồn đại đang xem xét "Project Stargate" có thể tốn tới 100 tỷ USD.

• Việc đào tạo mô hình AI đang rất hứa hẹn so với suy luận (thực sự "chạy" các mô hình AI). Có một cuộc chạy đua vũ trang với nhiều công ty được hậu thuẫn đang hướng tới trí tuệ nhân tạo tổng quát.

• Hiện tại, chưa có khái niệm rõ ràng về tiềm năng phát triển trong lĩnh vực này.

• Xu hướng này có thể tác động lớn đến các công ty như NVIDIA (Nasdaq: NVDA) và AMD (Nasdaq: AMD), những nhà cung cấp chính cho các chip GPU và bộ xử lý AI.

• Nhu cầu ngày càng tăng đối với sức mạnh tính toán AI đang thúc đẩy sự phát triển của các cụm máy tính khổng lồ này, với mục tiêu đạt được những bước tiến quan trọng trong lĩnh vực trí tuệ nhân tạo.

📌 Siêu máy tính với 1 triệu chip NVIDIA và AMD đang được phát triển, phản ánh nhu cầu tính toán AI khổng lồ. Các dự án như "Project Stargate" của Microsoft có thể tốn tới 100 tỷ USD. Xu hướng này thúc đẩy cuộc đua phát triển AI tổng quát với tiềm năng chưa xác định.

https://247wallst.com/investing/2024/07/04/supercomputers-with-1-million-nvidia-and-amd-chips-are-coming/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2024-07-05 00:05:36

tencent tăng 60% hiệu suất mạng ai mà không cần chip nvidia đỉnh cao

• Tencent đã nâng cấp mạng điện toán hiệu năng cao (HPC) của mình, cải thiện khả năng AI mà không cần sử dụng chip tiên tiến nhất của Nvidia.

• Phiên bản 2.0 của Mạng hiệu năng cao thông minh của Tencent (Xingmai) sẽ cải thiện hiệu quả truyền thông mạng và đào tạo mô hình ngôn ngữ lớn (LLM) lần lượt là 60% và 20%.

• Tencent đạt được cải thiện hiệu suất bằng cách tối ưu hóa cơ sở hạ tầng hiện có thay vì cạnh tranh trực tiếp với các đối thủ Mỹ như OpenAI về chi tiêu và bán dẫn tiên tiến.

• Mạng Xingmai có thể hỗ trợ một cụm máy tính với hơn 100.000 GPU, gấp đôi quy mô so với phiên bản ban đầu phát hành năm 2023.

• Hiệu suất được cải thiện rút ngắn thời gian cần thiết để xác định vấn đề chỉ còn vài phút, giảm từ vài ngày trước đây.

• Tencent gần đây đã đẩy mạnh việc tăng cường công nghệ trong lĩnh vực AI đang phát triển nhanh chóng, quảng bá các mô hình LLM nội bộ cho doanh nghiệp và cung cấp dịch vụ giúp các công ty khác xây dựng mô hình riêng.

• Ngành công nghiệp AI của Trung Quốc đang rơi vào cuộc chiến giá cả, với tất cả các công ty lớn đều giảm giá xuống thấp hơn nhiều so với các công ty phương Tây.

• Tencent đã cung cấp miễn phí phiên bản lite của mô hình LLM Hunyuan và cắt giảm cho các phiên bản tiêu chuẩn vào tháng 5.

• Cuộc đua cải thiện hiệu quả đào tạo mô hình rất quan trọng trong cuộc chiến giá bằng cách làm cho công nghệ trở nên phải chăng hơn cho các nhà khai thác và khách hàng của họ.

• Robin Li Yanhong, người sáng lập và CEO của Baidu, cho biết hiệu quả đào tạo mô hình LLM Ernie đã tăng hơn 5 lần trong vòng một năm. Hiệu suất suy luận của mô hình tăng 105 lần, giảm 99% chi phí suy luận.

• OpenAI cũng cho rằng những cải tiến hiệu quả gần đây là lý do cho mức giá thấp hơn nhiều của mô hình GPT-4 được ra mắt vào tháng 5.

📌 Tencent nâng cấp mạng HPC, cải thiện hiệu quả truyền thông mạng và đào tạo LLM lên 60% và 20%. Mạng Xingmai hỗ trợ 100.000 GPU, gấp đôi quy mô. Các công ty Trung Quốc đang tối ưu hóa hệ thống hiện có để thúc đẩy AI trong bối cảnh hạn chế tiếp cận chip tiên tiến của Mỹ.

https://www.scmp.com/tech/big-tech/article/3268901/tencent-boosts-ai-training-efficiency-without-nvidias-most-advanced-chips

Không có file đính kèm.

Nguồn tham khảo

105

AI market AI chips-hardware-compute 2024-07-04 23:14:14

Nvidia dự kiến đạt doanh thu 12 tỷ USD từ chip AI tại Trung Quốc năm nay bất chấp các biện pháp kiểm soát xuất khẩu của Mỹ

• Nvidia dự kiến sẽ bán được 12 tỷ USD chip AI tại Trung Quốc trong năm nay, bất chấp các biện pháp kiểm soát xuất khẩu của Mỹ.

• Công ty sẽ cung cấp hơn 1 triệu chip H20 mới trong những tháng tới, được thiết kế để tránh các hạn chế của Mỹ đối với việc bán bộ xử lý AI cho khách hàng Trung Quốc.

• Mỗi chip H20 có giá từ 12.000 đến 13.000 USD, dự kiến mang lại doanh thu trên 12 tỷ USD cho Nvidia.

• Con số này cao hơn doanh thu 10,3 tỷ USD từ toàn bộ hoạt động kinh doanh của Nvidia tại Trung Quốc trong năm tài chính kết thúc vào tháng 1/2024.

• Số lượng chip H20 bán ra gần gấp đôi so với dự kiến doanh số của sản phẩm cạnh tranh Ascend 910B do Huawei sản xuất tại Trung Quốc.

• Chính quyền Biden muốn hạn chế dòng chảy của các chip mạnh nhất thế giới đến Trung Quốc, lo ngại Bắc Kinh có thể sử dụng chúng để tạo ra các hệ thống AI mạnh mẽ hơn cho mục đích quân sự.

• Tình trạng thiếu chip AI đã ảnh hưởng đến khả năng cạnh tranh của các tập đoàn công nghệ Trung Quốc như ByteDance, Tencent và Alibaba với các công ty Mỹ như OpenAI, Microsoft, Meta và Google trong lĩnh vực AI.

• Dù doanh số tại Trung Quốc giảm trước khi ra mắt H20 vào mùa xuân này, các nhà phân tích cho rằng chip mới đang được vận chuyển với số lượng lớn và được khách hàng Trung Quốc ưa chuộng.

• Theo Dylan Patel của SemiAnalysis, mặc dù khả năng của H20 "trên giấy tờ" thấp hơn so với 910B của Huawei, nhưng trong thực tế chip của Nvidia "vượt trội hơn một chút" nhờ hiệu suất bộ nhớ vượt trội.

• Hầu hết các công ty AI Trung Quốc đã xây dựng mô hình AI của họ dựa trên hệ sinh thái và phần mềm của Nvidia. Việc chuyển sang cơ sở hạ tầng của Huawei sẽ tốn thời gian và chi phí.

📌 Bất chấp các hạn chế xuất khẩu của Mỹ, Nvidia dự kiến đạt doanh thu 12 tỷ USD từ chip AI H20 tại Trung Quốc trong năm nay, vượt xa đối thủ nội địa Huawei. Chip H20 được thiết kế để tránh các biện pháp kiểm soát, cho thấy khả năng thích ứng của Nvidia trước căng thẳng Mỹ-Trung trong lĩnh vực bán dẫn.

https://www.ft.com/content/b76ef55b-21cd-498b-ac16-5660908bb8d2

#FT

Không có file đính kèm.

Nguồn tham khảo

110

AI startup-M&A AI chips-hardware-compute 2024-07-04 22:52:20

Startup GPU Trung Quốc nâng cấp giải pháp trung tâm dữ liệu AI, bất chấp lệnh cấm của Mỹ

• Moore Threads, startup GPU Trung Quốc thành lập năm 2020, vừa công bố nâng cấp giải pháp trung tâm dữ liệu AI KUAE, tăng số lượng GPU có thể kết nối trong một cụm máy tính lên 10.000.

• Đây là nỗ lực của các công ty Trung Quốc nhằm bắt kịp khả năng AI bất chấp lệnh cấm xuất khẩu chip tiên tiến của Mỹ sang Trung Quốc.

• KUAE là máy chủ trung tâm dữ liệu tích hợp 8 GPU MTT S400 của Moore Threads, được thiết kế cho các mô hình ngôn ngữ lớn (LLM).

• MTT S400 dựa trên kiến trúc MUSA tự phát triển, có 128 lõi tensor và 48GB bộ nhớ GPU, với băng thông bộ nhớ 768 GB/giây.

• Các GPU có thể liên kết với nhau bằng công nghệ MTLink do Moore Threads phát triển, cho phép kết nối nhiều GPU tạo thành hệ thống mạnh mẽ hơn.

• Moore Threads vừa hoàn thành vòng tài trợ mới lên tới 2,5 tỷ nhân dân tệ (343,7 triệu USD).

• Mặc dù dẫn đầu lĩnh vực GPU đang bùng nổ ở Trung Quốc, Moore Threads vẫn thua kém Nvidia về hiệu năng sản phẩm.

• Phiên bản cơ bản của GPU A100 của Nvidia có 40GB bộ nhớ GPU băng thông cao và băng thông bộ nhớ 1.555 GB/giây, cung cấp sức mạnh tính toán gấp 3 lần MTT S400.

• Moore Threads đã ký thỏa thuận với các nhà khai thác viễn thông quốc doanh China Mobile, China Unicom và China Energy Engineering Corporation, cùng Gulin Huajue Big Data Technology để xây dựng 3 dự án cụm máy tính.

• Công ty được thành lập bởi một cựu lãnh đạo Nvidia Trung Quốc và bị đưa vào danh sách đen thương mại của Mỹ vào tháng 10/2023.

• Nvidia gần đây đã vượt qua Microsoft và Apple để trở thành công ty có giá trị nhất thế giới với vốn hóa thị trường 3,34 nghìn tỷ USD vào tháng 6.

📌 Moore Threads, startup GPU Trung Quốc, nâng cấp giải pháp AI lên 10.000 GPU kết nối, thu hút 2,5 tỷ nhân dân tệ đầu tư mới. Dù vẫn thua kém Nvidia, đây là nỗ lực đáng kể để bắt kịp công nghệ AI bất chấp lệnh cấm của Mỹ.

https://www.scmp.com/tech/tech-war/article/3269185/chinese-gpu-start-moore-threads-upgrades-its-ai-data-centre-solution-despite-us-restrictions

Không có file đính kèm.

Nguồn tham khảo

131

AI chips-hardware-compute 2024-07-01 23:30:36

Ngành ô tô Nhật đối mặt thách thức về chip AI, phụ thuộc vào công nghệ nước ngoài và chi phí cao.

• Startup xe tự lái Turing của Nhật Bản cho rằng ngành công nghiệp ô tô nước này đang phải đối mặt với chi phí cao hơn và có thể mất tự do thiết kế do chip AI ngày càng đắt đỏ và phụ thuộc nhiều vào các công ty nước ngoài như Nvidia.

• Motofumi Kashiwaya, trưởng nhóm phát triển bán dẫn của Turing, nhận định các công ty chip Nhật Bản giỏi về điều khiển xe thuần túy, nhưng trong lĩnh vực AI, Nvidia đã trở nên cạnh tranh hơn.

• Chip Orin do Nvidia thiết kế đã trở thành ứng cử viên chính cho việc xử lý hệ thống AI trên xe. GPU của Nvidia được coi là tốt nhất cho việc xử lý quy mô lớn cần thiết để đào tạo hoặc vận hành AI tiên tiến.

• Chi phí thiết kế một hệ thống trên chip (SoC) có thể lên tới ít nhất 10 tỷ yên (62 triệu USD) đối với các nhà sản xuất ô tô.

• Các công ty ô tô Nhật Bản đã thành lập liên minh ASRA để nghiên cứu chung và thống nhất một số thiết kế chip trong tương lai nhằm giảm chi phí.

• Keiji Yamamoto của Toyota cho rằng cán cân quyền lực giữa các nhà sản xuất ô tô và nhà sản xuất chip đã thay đổi, với các nhà sản xuất ô tô giờ đây phải chọn chip từ danh sách sản phẩm của các nhà sản xuất SoC toàn cầu.

• Turing đang phát triển chip AI riêng vì không tìm thấy chip hiện có nào có thể vận hành AI ở tốc độ cần thiết cho xe tự lái hoàn toàn.

• Công ty đặt cược vào AI tạo sinh, tin rằng đây là giải pháp tốt hơn so với cách tiếp cận thông thường kết hợp nhiều cảm biến với thuật toán AI dựa trên quy tắc.

• Turing dự kiến sẽ cần một mô hình AI "thông minh hơn" và chip mạnh mẽ hơn để vận hành AI đó. Sự kết hợp hiện tại giữa các mô hình AI tạo sinh và chip Nvidia vẫn chưa đáp ứng được yêu cầu của công ty.

• Turing đặt mục tiêu sản xuất chip thử nghiệm với số lượng nhỏ và khả năng hạn chế vào năm 2026. Chip mới, có tên mã Hummingbird, sẽ tập trung vào một mục đích duy nhất là chạy các chương trình AI tiên tiến trên xe.

• Công ty đã bắt đầu đàm phán ban đầu với các nhà máy sản xuất bán dẫn cho chip thử nghiệm và sẽ cần ít nhất vài trăm triệu yên để sản xuất thử nghiệm.

📌 Startup Turing cảnh báo ngành ô tô Nhật đối mặt thách thức về chip AI đắt đỏ và phụ thuộc công nghệ nước ngoài. Công ty đang phát triển chip AI riêng cho xe tự lái, dự kiến sản xuất thử nghiệm vào năm 2026 với chi phí hàng trăm triệu yên.

https://asia.nikkei.com/Business/Tech/Semiconductors/Japan-s-auto-industry-has-an-AI-chip-problem-says-self-driving-startup2

Không có file đính kèm.

Nguồn tham khảo

119

Semi-Cloud-DC-Green AI chips-hardware-compute 2024-06-30 17:58:59

SK Hynix đặt cược lớn vào tương lai AI với kế hoạch đầu tư 74,8 tỷ USD đến 2028, tập trung vào chip HBM

• SK Hynix, công ty con sản xuất chip của SK Group, công bố kế hoạch đầu tư 103 nghìn tỷ won (74,8 tỷ USD) đến năm 2028.

• Khoảng 80% số tiền đầu tư, tương đương 82 nghìn tỷ won, sẽ được dành cho phát triển chip bộ nhớ băng thông cao (HBM) - loại chip được tối ưu hóa để sử dụng với các bộ tăng tốc AI của Nvidia.

• SK Telecom và SK Broadband cũng sẽ đầu tư 3,4 nghìn tỷ won vào mảng kinh doanh trung tâm dữ liệu, nhằm đón đầu xu hướng AI.

• Kế hoạch này được công bố sau cuộc họp chiến lược thường niên kéo dài 20 giờ giữa Chủ tịch SK Group Chey Tae-won và khoảng 20 lãnh đạo cấp cao.

• SK Group đặt mục tiêu tạo ra 80 nghìn tỷ won doanh thu từ hoạt động kinh doanh và tái cơ cấu đến năm 2026.

• Tập đoàn cũng nhắm tới việc đạt 30 nghìn tỷ won dòng tiền tự do trong 3 năm tới, đồng thời giữ tỷ lệ nợ trên vốn chủ sở hữu dưới 100%.

• Sau khi lỗ 10 nghìn tỷ won năm ngoái, SK Group kỳ vọng đạt lợi nhuận trước thuế 22 nghìn tỷ won năm nay và tăng lên 40 nghìn tỷ won vào năm 2026.

• SK Hynix đã công bố nhiều kế hoạch đầu tư lớn trong năm nay, bao gồm 3,87 tỷ USD xây dựng nhà máy đóng gói tiên tiến và trung tâm nghiên cứu sản phẩm AI tại Indiana, Mỹ.

• Tại Hàn Quốc, SK Hynix đang chi 14,6 tỷ USD xây dựng khu phức hợp chip nhớ mới và tiếp tục các khoản đầu tư trong nước khác như Cụm Bán dẫn Yongin.

• Kế hoạch đầu tư tham vọng này diễn ra trong bối cảnh Chủ tịch Chey Tae-won cần tìm 1 tỷ USD để giải quyết vụ ly hôn, dẫn đến đồn đoán ông sẽ có động thái thúc đẩy tập đoàn để chi trả cho vợ cũ.

📌 SK Hynix đặt cược lớn vào tương lai AI với kế hoạch đầu tư 74,8 tỷ USD đến 2028, tập trung vào chip HBM. SK Group nhắm mục tiêu lợi nhuận 40 nghìn tỷ won năm 2026, tăng gấp đôi so với dự kiến 2024, thể hiện tham vọng tái cơ cấu mạnh mẽ.

https://www.bloomberg.com/news/articles/2024-06-30/sk-hynix-plans-to-invest-75-billion-on-chips-through-2028

Không có file đính kèm.

Nguồn tham khảo

125

AI chips-hardware-compute Semi-Cloud-DC-Green 2024-06-30 08:39:25

AI thúc đẩy đầu tư trung tâm dữ liệu tăng 28,5% và trở thành khối lượng công việc hàng đầu của server

• Theo báo cáo mới nhất của Omdia, AI đang là động lực chính thúc đẩy đầu tư vào trung tâm dữ liệu, dự kiến sẽ đẩy chi tiêu vốn cho các cơ sở này tăng gần 30% trong năm nay.

• AI đang trở thành danh mục phát triển nhanh nhất khi tính theo số lượng máy chủ triển khai mỗi năm. Dự báo AI sẽ vượt qua hầu hết các khối lượng công việc máy chủ khác như cơ sở dữ liệu và phân tích trong năm nay, và sẽ vượt qua viễn thông vào năm 2027.

• Chi tiêu vốn cho trung tâm dữ liệu dự kiến tăng 28,5% trong năm 2024, được hỗ trợ bởi dự trữ tiền mặt của các công ty hyperscaler lớn.

• Doanh số bán máy chủ dự kiến tăng 74% lên 210 tỷ USD trong năm nay, từ mức 121 tỷ USD năm 2023.

• Chi tiêu cho quản lý nhiệt trung tâm dữ liệu dự kiến tăng 22%, đạt 9,4 tỷ USD. Doanh thu cơ sở hạ tầng phân phối điện sẽ vượt 4 tỷ USD lần đầu tiên, và doanh thu bộ lưu điện sẽ tăng 10% lên 13 tỷ USD.

• Số lượng máy chủ dùng để đào tạo mô hình AI dự kiến chỉ tăng 5%/năm, trong khi máy chủ dùng cho suy luận AI tăng 17%/năm. Nguyên nhân là nhu cầu máy chủ đào tạo AI chủ yếu đến từ một số ít hyperscaler, tập trung vào tối ưu hóa hiệu suất phần cứng.

• Đào tạo AI được coi là hoạt động R&D và sẽ được phân bổ ngân sách dựa trên kế hoạch, tức là một phần doanh thu được tái đầu tư.

• Ngược lại, số lượng máy chủ cần cho suy luận AI sẽ tăng khi số người dùng ứng dụng AI tăng lên.

• Nhu cầu phần cứng máy chủ mạnh mẽ hơn đã thúc đẩy sự bùng nổ trong triển khai hệ thống làm mát bằng chất lỏng.

• Công nghệ làm mát trực tiếp đến chip một pha là loại phổ biến nhất nhờ tính đơn giản và trưởng thành. Làm mát trực tiếp đến chip hai pha hiện vẫn là công nghệ ngách nhưng có triển vọng tăng trưởng đáng kể.

• Hệ thống làm mát ngâm chìm tăng trưởng chậm hơn dự kiến do rào cản quy định và chi phí, chủ yếu vẫn được sử dụng trong điện toán hiệu năng cao.

• Tổng doanh thu hệ thống làm mát bằng chất lỏng dự kiến vượt 5 tỷ USD vào năm 2028, đạt mốc 2 tỷ USD vào cuối năm nay.

📌 AI đang thúc đẩy mạnh mẽ đầu tư vào trung tâm dữ liệu, với chi tiêu vốn tăng 28,5% trong năm 2024. Doanh số máy chủ dự kiến đạt 210 tỷ USD, tăng 74%. Công nghệ làm mát bằng chất lỏng cũng bùng nổ, dự kiến đạt doanh thu 2 tỷ USD cuối năm nay và 5 tỷ USD vào năm 2028.

https://www.theregister.com/2024/06/28/datacenter_capex_tai/

Không có file đính kèm.

Nguồn tham khảo

117

Semi-Cloud-DC-Green AI chips-hardware-compute 2024-06-28 16:12:09

Alibaba tiết lộ thiết kế mạng và trung tâm dữ liệu dùng để huấn luyện mô hình ngôn ngữ lớn

• Alibaba đã công bố thiết kế trung tâm dữ liệu mới dùng để huấn luyện mô hình ngôn ngữ lớn (LLM), sử dụng mạng dựa trên Ethernet.

• Mỗi máy chủ trong hệ thống chứa 8 GPU và 9 NIC, mỗi NIC có 2 cổng 200 GB/giây.

• Thiết kế này đã được sử dụng trong sản xuất trong 8 tháng, nhằm tối đa hóa khả năng PCIe của GPU và tăng dung lượng gửi/nhận của mạng.

• Alibaba sử dụng NVlink cho mạng nội bộ trong máy chủ, cung cấp băng thông lớn hơn giữa các máy chủ.

• Mỗi cổng trên NIC được kết nối với một switch đầu giá khác nhau để tránh điểm lỗi đơn lẻ, một thiết kế mà Alibaba gọi là "rail-optimized".

• Mỗi pod chứa 15.000 GPU và có thể được đặt trong một trung tâm dữ liệu duy nhất.

• Alibaba phát triển kiến trúc mạng mới này do các mô hình lưu lượng trong đào tạo LLM khác với điện toán đám mây thông thường, với lưu lượng entropy thấp và bùng nổ.

• Công ty tự thiết kế và tạo ra bộ tản nhiệt buồng hơi riêng, cùng với việc sử dụng nhiều cột bấc hơn ở trung tâm chip để tản nhiệt hiệu quả hơn.

• Giải pháp làm mát này giúp duy trì nhiệt độ chip dưới 105°C, ngưỡng mà các switch bắt đầu tắt.

• Mỗi tòa nhà trung tâm dữ liệu của Alibaba Cloud có giới hạn công suất tổng thể là 18MW, có thể chứa khoảng 15.000 GPU.

• Thiết kế này cho phép mỗi tòa nhà chứa một pod hoàn chỉnh, với phần lớn các liên kết nằm trong cùng một tòa nhà.

• Alibaba cũng cung cấp một trong những mô hình ngôn ngữ lớn tốt nhất thông qua mô hình Qwen của họ, được đào tạo trên 110 tỷ tham số.

📌 Alibaba đã phát triển một thiết kế trung tâm dữ liệu tiên tiến cho việc huấn luyện LLM, với mạng Ethernet tùy chỉnh và 15.000 GPU mỗi pod. Giải pháp làm mát độc đáo và kiến trúc mạng mới giúp tối ưu hóa hiệu suất và khả năng mở rộng cho đào tạo AI quy mô lớn.

https://www.techradar.com/pro/website-hosting/alibaba-unveils-its-network-and-datacenter-design-for-large-language-model-training

Không có file đính kèm.

Nguồn tham khảo

133

AI chips-hardware-compute 2024-06-27 22:34:33

Chip AI Sohu tuyên bố chạy mô hình nhanh hơn và rẻ hơn 20 lần so với GPU Nvidia H100

• Startup Etched vừa công bố chip Sohu, một mạch tích hợp chuyên dụng (ASIC) được thiết kế riêng cho các mô hình transformer AI.

• Sohu tuyên bố vượt trội hơn GPU Nvidia H100 trong việc suy luận mô hình ngôn ngữ lớn (LLM).

• Một máy chủ 8xSohu được cho là có hiệu suất tương đương 160 GPU H100, giúp trung tâm dữ liệu tiết kiệm chi phí ban đầu và vận hành.

• Các bộ tăng tốc AI hiện tại (CPU hoặc GPU) được thiết kế để hoạt động với nhiều kiến trúc AI khác nhau, dẫn đến việc phân bổ phần lớn sức mạnh tính toán cho khả năng lập trình.

• Etched ước tính chỉ 3,3% transistor của GPU Nvidia H100 được sử dụng cho phép nhân ma trận - nhiệm vụ chính của LLM.

• Kiến trúc transformer AI đã trở nên phổ biến gần đây, với các mô hình nổi tiếng như ChatGPT, Sora, Gemini, Stable Diffusion và DALL-E đều dựa trên nó.

• Etched đã đặt cược lớn vào transformer khi bắt đầu dự án Sohu cách đây vài năm, tích hợp kiến trúc này vào phần cứng.

• Chiến lược này cho phép Sohu phân bổ nhiều transistor hơn cho tính toán AI, tương tự như GPU chuyên biệt cho xử lý đồ họa.

• Sohu chỉ hoạt động với mô hình transformer, khác với các chip AI hiện tại có thể hỗ trợ nhiều kiến trúc khác nhau.

• Sự ra đời của Sohu có thể đe dọa vị thế dẫn đầu của Nvidia trong lĩnh vực AI, đặc biệt nếu các công ty chỉ sử dụng mô hình transformer chuyển sang Sohu.

• Hiệu quả là chìa khóa để chiến thắng trong cuộc đua AI, và Sohu hứa hẹn mang lại phần cứng nhanh nhất và giá cả phải chăng nhất.

• Các chuyên gia lo ngại về khủng hoảng tiêu thụ điện năng do cơ sở hạ tầng AI gây ra. Mark Zuckerberg cho rằng nguồn cung điện sẽ hạn chế sự phát triển của AI.

• Các GPU bán ra năm ngoái tiêu thụ nhiều điện hơn 1,3 triệu hộ gia đình.

• Nếu cách tiếp cận của Etched với Sohu thành công, có thể giảm nhu cầu điện năng cho AI xuống mức quản lý được, cho phép lưới điện bắt kịp khi nhu cầu tính toán tăng lên một cách bền vững hơn.

📌 Chip AI Sohu của Etched hứa hẹn hiệu suất gấp 20 lần Nvidia H100 với chi phí thấp hơn. Thiết kế chuyên biệt cho mô hình transformer có thể cách mạng hóa trung tâm dữ liệu AI, giảm tiêu thụ điện từ 1,3 triệu hộ gia đình xuống mức bền vững hơn.

https://www.tomshardware.com/tech-industry/artificial-intelligence/sohu-ai-chip-claimed-to-run-models-20x-faster-and-cheaper-than-nvidia-h100-gpus

Không có file đính kèm.

Nguồn tham khảo

100

AI chips-hardware-compute 2024-06-27 22:19:19

Huawei gặp khó khăn trong sản xuất GPU do lệnh trừng phạt của Mỹ

• Huawei đang gặp khó khăn trong việc tăng sản lượng GPU Ascend 910B do các lệnh trừng phạt của Mỹ

• Ascend 910B được coi là câu trả lời của Trung Quốc cho GPU của Nvidia, có hiệu năng tương đương A100 của Nvidia

• Chip được cho là thiết kế nội bộ của Huawei, sản xuất bởi SMIC trên quy trình 7nm

• Khách hàng Trung Quốc ưa chuộng Ascend 910B hơn các GPU đặc biệt của Nvidia dành cho thị trường này

• Vấn đề nằm ở thiết bị sản xuất chip tiên tiến được thiết kế cho các quy trình cũ hơn, gây ra các vấn đề kỹ thuật khi tái sử dụng

• Mỹ tiếp tục siết chặt việc cung cấp thiết bị sản xuất chip cho Trung Quốc, thuyết phục cả đồng minh như Nhật Bản và Hà Lan tham gia

• Thiết bị EUV tiên tiến nhất đã bị cấm bán cho Trung Quốc, năm ngoái Mỹ mở rộng lệnh cấm sang cả một số thiết bị DUV

• Năm nay, Mỹ thuyết phục các nhà cung cấp thiết bị sản xuất chip không thực hiện các thỏa thuận bảo trì với các công ty bán dẫn Trung Quốc

• Chủ tịch Tập Cận Bình kêu gọi tăng cường đổi mới khoa học công nghệ, đặc biệt trong 6 lĩnh vực bao gồm bán dẫn

• Ông Tập nhấn mạnh việc đảm bảo các chuỗi công nghiệp và cung ứng quan trọng độc lập, an toàn và có thể kiểm soát được

• Mục tiêu của Trung Quốc là trở thành "cường quốc công nghệ" vào năm 2035

• Ông Tập cho rằng "cuộc cách mạng khoa học công nghệ và cuộc chơi giữa các cường quốc đan xen lẫn nhau"

• Huawei được cho là đang nghiên cứu phát triển thiết bị sản xuất chip riêng gần Thượng Hải, bao gồm cả máy quang khắc

📌 Huawei gặp khó trong sản xuất GPU Ascend 910B do lệnh cấm Mỹ. Chủ tịch Tập kêu gọi Trung Quốc tự chủ công nghệ, đặt mục tiêu thành cường quốc công nghệ năm 2035. Cuộc đua công nghệ giữa các nước lớn ngày càng gay gắt, tập trung vào lĩnh vực bán dẫn.

https://www.theregister.com/2024/06/26/huawei_struggling_to_ramp_gpu/

Không có file đính kèm.

Nguồn tham khảo

105

AI chips-hardware-compute 2024-06-27 21:48:37

AMD tiết lộ kế hoạch xây dựng cụm AI "quái vật" với 1,2 triệu GPU, vượt xa mọi siêu máy tính hiện có

• AMD đang cân nhắc xây dựng một cụm AI khổng lồ với khoảng 1,2 triệu GPU, gấp hơn 20 lần số lượng GPU trong các siêu máy tính mạnh nhất hiện nay.

• Thông tin này được tiết lộ bởi Forrest Norrod, Phó Chủ tịch kiêm Tổng Giám đốc mảng kinh doanh trung tâm dữ liệu của AMD, trong một cuộc phỏng vấn với The Next Platform.

• Norrod mô tả quy mô của dự án này là "đáng kinh ngạc" và thừa nhận rằng nó có thể sẽ được thực hiện hoặc không.

• Các công ty đang cân nhắc chi hàng chục tỷ, thậm chí cả trăm tỷ đô la cho các dự án AI trong tương lai.

• Để so sánh, siêu máy tính Frontier của AMD hiện đang xếp hạng số 1 thế giới, với chi phí chỉ 600 triệu đô la và có 37.888 GPU MI250X.

• AMD đã chiếm 30% thị phần CPU trong thị trường trung tâm dữ liệu, nhưng vẫn đang phải đối mặt với sự cạnh tranh gay gắt từ Nvidia trong lĩnh vực GPU.

• Ưu tiên hàng đầu của AMD là giảm thiểu ma sát trong việc áp dụng công nghệ của họ, đặc biệt khi Nvidia đang thống trị không chỉ về phần cứng mà còn cả phần mềm CUDA.

• Khi được hỏi liệu AMD có thể tạo ra một bản sao của phần cứng Nvidia để bán hay không, Norrod trả lời rằng họ "không thể làm điều đó".

• Dự án này, nếu được thực hiện, sẽ đánh dấu một bước tiến quan trọng trong cuộc đua AI và có thể thay đổi cục diện của ngành công nghiệp siêu máy tính.

• Việc xây dựng một cụm AI với quy mô như vậy sẽ đòi hỏi một khoản đầu tư khổng lồ về tài chính và công nghệ, vượt xa chi phí của các siêu máy tính hiện tại.

• Tuy nhiên, vẫn còn nhiều thách thức cần phải vượt qua, bao gồm cả việc phát triển công nghệ để quản lý và vận hành một hệ thống lớn như vậy.

📌 AMD tiết lộ kế hoạch xây dựng cụm AI với 1,2 triệu GPU, gấp 20 lần siêu máy tính hiện tại. Dự án tham vọng này có thể đòi hỏi đầu tư hàng trăm tỷ đô la, đánh dấu bước ngoặt trong ngành AI và siêu máy tính.

https://www.extremetech.com/computing/amd-says-an-ai-cluster-with-12-million-gpus-could-be-in-the-cards

Không có file đính kèm.

Nguồn tham khảo

119

AI chips-hardware-compute 2024-06-26 20:44:59

Intel Lunar Lake: Chip AI sẽ đánh bại cả Apple M3 và Qualcomm Snapdragon X?

• Intel sắp ra mắt dòng chip Lunar Lake mới cho laptop, hứa hẹn mang lại hiệu năng và hiệu suất năng lượng vượt trội so với thế hệ Meteor Lake trước đó.

• Lunar Lake sử dụng thiết kế SoC tích hợp CPU, NPU và GPU Xe2 trên cùng một chip. NPU có hiệu năng 48 TOPS, GPU trên 67 TOPS, tổng cộng trên 100 TOPS cho tính toán AI.

• Cấu trúc chip mới gồm 4 nhân P-core "Lion Cove" và 4 nhân E-core "Skymount". E-core mới mạnh hơn và tiết kiệm điện hơn P-core 2023 ở tốc độ xung nhịp thông thường của laptop.

• GPU Xe2 tích hợp cải thiện 1,5 lần so với Meteor Lake trong 3DMark Time Spy. Hỗ trợ ray tracing và các công nghệ mới.

• RAM LPDDR5X 16GB hoặc 32GB được tích hợp sẵn trên chip, không thể nâng cấp sau.

• Intel hứa hẹn thời lượng pin tăng 60% so với Meteor Lake nhờ các cải tiến như RAM tích hợp, E-core tiết kiệm điện và Enhanced Intel Thread Director mới.

• So với Qualcomm Snapdragon X và Apple M3/M4, Intel tự tin Lunar Lake sẽ cạnh tranh sát sao về hiệu năng và thời lượng pin.

• Lunar Lake dự kiến ra mắt vào mùa lễ hội cuối năm 2024.

• Vẫn cần chờ đợi các bài đánh giá thực tế để biết chính xác hiệu năng và thời lượng pin của Lunar Lake so với đối thủ.

• Khoảng cách về thời lượng pin giữa laptop Windows và macOS đang dần được thu hẹp nhờ các cải tiến từ Intel và Qualcomm.

📌 Intel Lunar Lake hứa hẹn mang lại cuộc cách mạng cho laptop Windows với hiệu năng AI trên 100 TOPS, thời lượng pin tăng 60% và khả năng cạnh tranh ngang ngửa Apple M3/M4. Dự kiến ra mắt cuối 2024, Lunar Lake sẽ thu hẹp khoảng cách giữa laptop Windows và macOS.

https://www.makeuseof.com/what-are-intel-ai-lunar-lake-chips/

Không có file đính kèm.

Nguồn tham khảo

130

AI chips-hardware-compute Semi-Cloud-DC-Green 2024-06-25 18:58:03

Alibaba Cloud ra mắt hàng nghìn mô hình AI Trung Quốc ra toàn cầu

- Alibaba Cloud đã tạo ra phiên bản tiếng Anh của Modelscope, dịch vụ cung cấp mô hình AI dưới dạng dịch vụ (models-as-service).
- Modelscope ra mắt từ năm 2022, tương tự như AWS Bedrock hay Azure OpenAI Studio, cung cấp thư viện các mô hình nền tảng từ nhiều nguồn để tích hợp vào ứng dụng trên nền tảng đám mây.
- Alibaba Cloud tuyên bố có hơn 5 triệu nhà phát triển sử dụng Modelscope từ khi ra mắt, với hơn 5.000 mô hình.
- Dịch vụ bao gồm các mô hình "Qwen" của Alibaba Cloud và nhiều mô hình từ các startup Trung Quốc.
- Modelscope cung cấp hơn 1.500 bộ dữ liệu tiếng Trung chất lượng cao và nhiều công cụ hỗ trợ xử lý dữ liệu.
- Phiên bản tiếng Anh của Modelscope quan trọng vì tiếng Anh phổ biến hơn tiếng Quan Thoại ở các thị trường mục tiêu của Alibaba Cloud như Đông Nam Á.
- Alibaba Cloud đứng thứ 3 về thị phần doanh thu đám mây ở một số thị trường châu Á, đôi khi vượt qua cả Google.
- Alibaba Cloud có tham vọng lớn với 89 khu vực khả dụng tại 30 vùng, trong đó 16 vùng nằm ngoài Trung Quốc đại lục.
- Tuy nhiên, Alibaba Cloud không tránh khỏi lo ngại về luật an ninh quốc gia của Trung Quốc buộc phải chia sẻ thông tin với Bắc Kinh khi được yêu cầu.
- Nhiều khách hàng phương Tây cho rằng Alibaba Cloud có mức rủi ro cao hơn so với các đối thủ.
- Chính phủ Mỹ đã hạn chế hoạt động của các nhà mạng Trung Quốc như China Mobile, China Telecom và China Unicom vì lo ngại an ninh quốc gia.

📌 Modelscope phiên bản tiếng Anh của Alibaba Cloud cung cấp hơn 5.000 mô hình AI và 1.500 bộ dữ liệu tiếng Trung chất lượng cao. Tuy nhiên, dịch vụ này vẫn gặp phải lo ngại về rủi ro địa chính trị do luật an ninh quốc gia của Trung Quốc, khiến nhiều khách hàng phương Tây e dè bất chấp tiềm năng hấp dẫn của các mô hình và dữ liệu được cung cấp.

https://www.theregister.com/2024/06/25/alibaba_modelscope_english_translation/

Không có file đính kèm.

Nguồn tham khảo

125

Semi-Cloud-DC-Green AI chips-hardware-compute 2024-06-25 18:48:10

Tâm lý "sợ bỏ lỡ" của Singapore giữa sự trỗi dậy của trung tâm dữ liệu AI

- Singapore gần đây bất ngờ thông báo sẽ giải phóng thêm năng lượng cho việc mở rộng trung tâm dữ liệu, sau khi các CEO của Nvidia, Google, Microsoft cam kết đầu tư hàng tỷ USD vào trung tâm dữ liệu, điện toán đám mây và AI ở Malaysia.
- Từ 2019-2022, Singapore đã cấm xây dựng trung tâm dữ liệu mới do tiêu thụ quá nhiều tài nguyên. Lệnh cấm này đẩy các công ty sang Johor (Malaysia) và Batam (Indonesia).
- Singapore, như nhiều nước khác, đã đánh giá thấp mức độ tăng trưởng nhu cầu về AI sẽ mở rộng thị trường trung tâm dữ liệu toàn cầu. Nước này muốn trở thành trung tâm AI của Đông Nam Á.
- Singapore không thể cạnh tranh về đất đai và năng lượng với các nước láng giềng, nhưng có thể bổ trợ cho nhau. Johor được các gã khổng lồ công nghệ ưa chuộng vì gần Singapore - nơi kết nối mạnh mẽ.
- Singapore có thể thúc đẩy chiến lược "Singapore + 1", trong đó các công ty đặt trụ sở tại Singapore để tận dụng môi trường kinh doanh quốc tế, các hiệp định thương mại tự do và nguồn nhân tài, nhưng đặt cơ sở sản xuất hoặc trung tâm dữ liệu ở những nơi như Johor.
- Từ 2013-2022, Singapore là nước nhận vốn FDI cao nhất Đông Nam Á, chiếm hơn 50% tổng lượng vốn của khu vực năm 2022 (141 tỷ USD).

📌 Singapore đang chứng kiến sự trỗi dậy của trung tâm dữ liệu AI và tâm lý "sợ bỏ lỡ" khi các nước láng giềng như Malaysia thu hút đầu tư khổng lồ từ các gã khổng lồ công nghệ. Tuy nhiên, với vị thế kết nối mạnh mẽ và môi trường kinh doanh thuận lợi, Singapore hoàn toàn có thể bổ trợ và hưởng lợi từ xu hướng này thông qua các chiến lược như "Singapore + 1".

https://www.ft.com/content/49f6b682-311b-4ab1-b6bc-2ec8e1feec0b

#FT

Không có file đính kèm.

Nguồn tham khảo

132

AI chips-hardware-compute 2024-06-25 08:33:19

Supermicro đang hưởng lợi từ sự bùng nổ của AI với doanh thu tăng 200% so với năm ngoái

- Doanh thu của Supermicro tăng 200% so với năm ngoái nhờ nhu cầu về máy chủ AI từ các doanh nghiệp. Các nhà phân tích dự đoán doanh thu của công ty có thể tăng gấp đôi trong 1-2 năm tài chính tới.

- Elon Musk thông báo Dell và Supermicro sẽ cung cấp mỗi bên một nửa máy chủ cho startup AI xAI. Tăng trưởng của Supermicro vượt qua cả Dell gần đây.

- Supermicro sẽ sản xuất 5.000 giá đỡ thiết bị mỗi tháng tại nhà máy mới ở Malaysia từ quý 4. Công nghệ làm mát chất lỏng trực tiếp (DLC) độc quyền của công ty dự kiến tăng trưởng 2.900% trong 2 năm.

- DLC sẽ được cài đặt trong 15% giá đỡ mà công ty xuất xưởng năm nay và tăng gấp đôi vào năm tới. CEO Charles Liang dự đoán 20% trung tâm dữ liệu sẽ sớm áp dụng công nghệ làm mát bằng chất lỏng.

- Trung tâm dữ liệu sử dụng làm mát bằng chất lỏng tiêu thụ ít năng lượng hơn và cho phép triển khai mật độ cao, năng suất hơn. Điều này tạo thách thức cho các đối thủ mới trong lĩnh vực suy luận AI muốn loại bỏ GPU.

📌 Supermicro đang tận dụng sự bùng nổ của AI với doanh thu tăng 200%, cung cấp giải pháp máy chủ và công nghệ DLC cho các trung tâm dữ liệu. Công ty dự kiến sản lượng DLC tăng 2.900% trong 2 năm tới, giúp giảm tiêu thụ năng lượng và tăng mật độ triển khai, đồng thời tạo thách thức cho các đối thủ mới muốn loại bỏ GPU trong lĩnh vực AI.

https://venturebeat.com/ai/nvidia-gets-the-glory-but-supermicro-is-the-unsung-hero-of-the-ai-revolution-learn-more-at-vb-transform/

Không có file đính kèm.

Nguồn tham khảo

116

AI chips-hardware-compute 2024-06-25 07:41:49

Chip Blackwell của Nvidia đánh dấu bước tiến vượt bậc về hiệu quả năng lượng, với mức cải thiện ấn tượng 25 lần

- Thách thức về tiêu thụ năng lượng là một trở ngại đáng kể trong lĩnh vực AI tạo sinh, bất chấp tiềm năng to lớn của nó. Hiểu được chi phí liên quan đến các hệ thống này là rất quan trọng để chúng được áp dụng rộng rãi.

- Nvidia Corporation đã giới thiệu nền tảng Blackwell như giải pháp thế hệ tiếp theo, nhằm giải quyết vấn đề then chốt này. So với người tiền nhiệm Hopper, nền tảng Blackwell thể hiện những tiến bộ đáng kể về hiệu quả chi phí và tiết kiệm năng lượng.

- Mỗi chip Nvidia H100 tiêu thụ 700W năng lượng ở hiệu suất đỉnh, vượt quá mức tiêu thụ điện năng của một hộ gia đình Mỹ trung bình. Tổng cộng, chip AI hiệu suất cao của NVDA được ước tính sẽ vượt quá mức tiêu thụ năng lượng của nhiều quốc gia nhỏ.

- Nền tảng Blackwell của NVDA là một bước đột phá, với cải tiến đáng kể 25 lần về hiệu quả năng lượng. Tiến bộ này không chỉ củng cố vị trí dẫn đầu của NVDA trong ngành mà còn giúp việc vận hành chip của họ bền vững về mặt kinh tế.

- Nền tảng sắp tới của NVDA, Rubin, dự kiến ra mắt vào năm 2026, được kỳ vọng sẽ tiếp tục cải tiến khả năng tiết kiệm năng lượng do Blackwell mang lại, tận dụng các đổi mới công nghệ như CPU Versa và Bộ nhớ HBM4 để tăng cường lợi thế cạnh tranh của NVDA.

📌 Chip Blackwell của Nvidia đánh dấu bước tiến vượt bậc về hiệu quả năng lượng, với mức cải thiện ấn tượng 25 lần. Điều này mở đường cho việc triển khai rộng rãi các chip NVDA, được hỗ trợ bởi đường ống sản phẩm mới mạnh mẽ như nền tảng Rubin và hệ sinh thái phần mềm, bất chấp những lo ngại về định giá và cạnh tranh gay gắt.

Citations:
[1] https://seekingalpha.com/article/4700723-nvidia-blackwell-finally-addresses-an-ai-bottleneck
[2] https://www.scmp.com/tech/tech-war/article/3265192/new-nvidia-blackwell-gpus-put-china-further-behind-global-leading-edge-ai-chips-amid-us-sanctions
[3] https://asia.nikkei.com/Business/Tech/Semiconductors/Nvidia-unveils-Blackwell-GPU-for-AI-as-successor-to-Hopper-chip
[4] https://devs-core.com/unveiling-potential-nvidias-blackwell-ai-chip/
[5] https://www.amax.com/top-5-considerations-for-deploying-nvidia-blackwell/

Không có file đính kèm.

Nguồn tham khảo

112

AI chips-hardware-compute Semi-Cloud-DC-Green 2024-06-24 15:51:58

Cuộc đua kịch tính giữa SoftBank, KDDI biến nhà máy LCD thành trung tâm dữ liệu AI khổng lồ

- Đầu tháng 6/2024, KDDI thông báo hợp tác với Sharp để biến nhà máy LCD gặp khó khăn ở Sakai thành trung tâm dữ liệu AI. Chỉ 4 ngày sau, SoftBank tuyên bố đã giành quyền đàm phán độc quyền để mua lại phần lớn nhà máy này từ Sharp.

- Nhà máy Sakai nằm trên khu công nghiệp rộng khoảng 700.000 m2 được xây dựng trên đất lấn biển ở vịnh Osaka. Đây là nhà máy chính sản xuất màn hình TV lớn của Sharp. Tuy nhiên, Sharp sẽ ngừng sản xuất các tấm nền LCD này từ tháng 9 do cạnh tranh gay gắt từ các đối thủ Trung Quốc.

- SoftBank dường như đang dẫn đầu khi đàm phán mua 60% nhà máy Sakai, bao gồm nhà máy tấm nền TV chính và các cơ sở điện, khí đốt. Họ sẽ biến nhà máy thành trung tâm dữ liệu khi tập trung vào các lĩnh vực AI. SoftBank Group có kế hoạch chi 10 nghìn tỷ yên (63 tỷ USD) để trở thành một thế lực về AI.

- KDDI cho biết họ đang đàm phán với Sharp và các công ty như Super Micro Computer của Mỹ, nhằm xây dựng "một trong những trung tâm dữ liệu AI lớn nhất châu Á", sử dụng 1.000 hệ thống AI quy mô giá đỡ do Nvidia thiết kế. Tuy nhiên, việc SoftBank tham gia vào cuộc đua có thể khiến KDDI gặp khó khăn hơn trong đàm phán.

- Việc chuyển đổi nhà máy LCD thành trung tâm dữ liệu AI cho thấy nhu cầu cấp bách của Nhật Bản về năng lực tính toán AI. Xây dựng trung tâm dữ liệu mới có thể mất nhiều năm. Tại Nhật, tỷ lệ lấp đầy của các trung tâm dữ liệu ở Tokyo đã lên tới 87% vào cuối năm 2023.

- Nhà máy Sakai đặc biệt phù hợp để chuyển đổi thành trung tâm dữ liệu AI nhờ các tiện ích điện và nguồn nước làm mát sẵn có, vốn được xây dựng để đáp ứng nhu cầu sản xuất LCD. Vị trí của nó ở Osaka cũng thuận lợi để phân tán năng lực tính toán, tránh gián đoạn khi xảy ra thảm họa.

- Đối với Sharp, việc chuyển đổi nhà máy Sakai có thể là giải pháp cho vấn đề thua lỗ kéo dài từ mảng kinh doanh LCD. Tuy nhiên, vẫn chưa rõ số phận của khoảng 800 công nhân, chủ yếu trong lĩnh vực sản xuất, tại nhà máy này sau khi ngừng sản xuất tấm nền LCD vào tháng 9.

📌 Cuộc đua giữa các công ty viễn thông lớn của Nhật Bản như SoftBank và KDDI nhằm biến nhà máy LCD của Sharp ở Sakai thành trung tâm dữ liệu AI khổng lồ cho thấy tham vọng của Nhật trong lĩnh vực trí tuệ nhân tạo. Với cơ sở hạ tầng điện, nước làm mát sẵn có và vị trí thuận lợi, nhà máy Sakai hứa hẹn sẽ trở thành một mắt xích quan trọng giúp Nhật Bản nhanh chóng có được năng lực tính toán AI đáng kể, qua đó trở thành một cường quốc về AI trong tương lai gần. Tuy nhiên, vẫn còn nhiều vấn đề cần giải quyết như việc sắp xếp lại lực lượng lao động tại nhà máy sau khi chuyển đổi.

https://asia.nikkei.com/Business/Business-Spotlight/The-AI-scramble-Why-SoftBank-KDDI-and-others-are-racing-for-Sharp-s-LCD-factory

Không có file đính kèm.

Nguồn tham khảo

135

AI chips-hardware-compute 2024-06-21 15:56:40

Elon Musk tuyên bố siêu cụm máy tính AI mới của Tesla sẽ tăng lên hơn 500 MW trong 18 tháng tới

- Elon Musk tuyên bố siêu cụm máy tính AI mới của Tesla sẽ tăng lên hơn 500 MW trong 18 tháng tới, trở thành một trong những cụm lớn nhất thế giới.
- Tesla đang gặp khó khăn trong việc xây dựng mở rộng Gigafactory Texas để chứa siêu máy tính khổng lồ mới nhằm huấn luyện AI.
- Ban đầu, Tesla đặt mục tiêu cụm 100 MW sẵn sàng vào tháng 8. Musk đã hủy các dự án khác để tập trung nguồn lực xây dựng cho việc mở rộng này.
- Musk xác nhận Tesla dự định sử dụng cả phần cứng của riêng mình và của Nvidia cũng như các nhà cung cấp khác.
- Có sự không rõ ràng khi Musk ám chỉ Tesla sẽ sử dụng một số máy tính HW4 cho các cụm huấn luyện, trong khi HW4 thường đề cập đến máy tính trong xe của Tesla.
- Musk đề cập tại cuộc họp cổ đông rằng Tesla hiện có chip AI đẳng cấp Nvidia, nhưng cổ phiếu hầu như không dao động trước thông báo này.
- Nỗ lực AI của Tesla vẫn chưa thực sự đáng tin cậy đối với thị trường do những tuyên bố chưa thành hiện thực về khả năng tự lái trong 5 năm qua.
- Tesla cần thể hiện cải tiến đáng kể với FSD qua mỗi bản cập nhật mới. Siêu cụm máy tính mới dường như sẽ giúp đạt được điều này.

📌 Elon Musk tuyên bố siêu cụm máy tính AI 500 MW của Tesla sẽ trở thành một trong những cụm lớn nhất thế giới, đồng thời đạt hiệu suất kỷ lục với chip AI thế hệ tiếp theo. Tuy nhiên, nỗ lực AI của Tesla vẫn chưa thực sự thuyết phục thị trường do những cam kết chưa thành về khả năng tự lái trong nhiều năm qua.

https://electrek.co/2024/06/20/elon-musk-tesla-new-ai-supercluster-over-500-mw-record-ai-chip/

Không có file đính kèm.

Nguồn tham khảo

136

Semi-Cloud-DC-Green AI chips-hardware-compute 2024-06-21 00:24:39

siêu máy tính ai azure: sức mạnh đằng sau những mô hình ngôn ngữ lớn nhất thế giới

- Azure đã phát triển từ sử dụng một thiết kế máy chủ tiêu chuẩn duy nhất đến nhiều loại máy chủ khác nhau, bao gồm GPU và bộ tăng tốc AI.

- Quy mô của các hệ thống cần thiết để chạy các nền tảng AI này là rất lớn. Siêu máy tính huấn luyện AI đầu tiên của Microsoft có 10.000 GPU Nvidia V100 và xếp thứ 5 trong bảng xếp hạng siêu máy tính toàn cầu. Đến tháng 11/2023, phiên bản mới nhất có 14.400 GPU H100 và xếp thứ 3.

- Tính đến tháng 6/2024, Microsoft có hơn 30 siêu máy tính tương tự trên toàn thế giới. Mô hình nguồn mở Llama-3-70B cần 6,4 triệu giờ GPU để huấn luyện, tương đương 730 năm trên một GPU. Nhưng với siêu máy tính AI của Microsoft, một lần chạy huấn luyện chỉ mất khoảng 27 ngày.

- Microsoft đã phát triển bộ tăng tốc suy luận Maia của riêng mình, sử dụng hệ thống làm mát chất lỏng kín mới. Project POLCA của Azure nhằm tăng hiệu quả bằng cách cho phép nhiều hoạt động suy luận chạy cùng lúc.

- Microsoft đã đầu tư đáng kể vào các kết nối InfiniBand băng thông cao, sử dụng 1,2TBps kết nối nội bộ trong máy chủ và 400Gbps giữa các GPU riêng lẻ trong các máy chủ khác nhau.

- Project Forge cung cấp công cụ quản lý tài nguyên và lan truyền tải trên các loại tính toán AI khác nhau. Nó xem tất cả các bộ tăng tốc AI có sẵn trong Azure như một nhóm duy nhất, gọi là One Pool.

- Project Flywheel có thể đảm bảo hiệu suất bằng cách xen kẽ các hoạt động từ nhiều lời nhắc trên các GPU ảo. Azure hiện có thể có VM bảo mật hoàn toàn, bao gồm cả GPU, với các thông điệp được mã hóa giữa CPU và môi trường thực thi đáng tin cậy của GPU.

📌 Microsoft đang đầu tư mạnh mẽ vào cơ sở hạ tầng và nền tảng AI, với hơn 30 siêu máy tính trên toàn cầu, mỗi máy có tới 14.400 GPU H100. Các công nghệ như bộ tăng tốc suy luận Maia, mạng InfiniBand 1,2TBps, Project Forge và Project Flywheel giúp tăng hiệu quả, độ tin cậy và bảo mật cho cả quá trình huấn luyện và suy luận AI quy mô lớn.

https://www.infoworld.com/article/3715661/inside-todays-azure-ai-cloud-data-centers.html

Không có file đính kèm.

Nguồn tham khảo

119

AI an toàn-an ninh-techwar AI chips-hardware-compute 2024-06-19 16:52:20

Mỹ tìm kiếm sự hỗ trợ từ Nhật Bản và Hà Lan để hạn chế tiến bộ của Trung Quốc trong lĩnh vực chip AI

- Một quan chức cấp cao của Mỹ sẽ đến thăm Nhật Bản và Hà Lan để yêu cầu hai nước này áp đặt thêm các hạn chế đối với ngành công nghiệp bán dẫn của Trung Quốc, đặc biệt là khả năng sản xuất các chip bộ nhớ băng thông cao (HBM) cần thiết cho trí tuệ nhân tạo (AI).
- Alan Estevez, Thứ trưởng Bộ Thương mại Mỹ phụ trách Công nghiệp và An ninh, sẽ thúc giục các đối tác ở Tokyo và The Hague hạn chế hoạt động của các nhà cung cấp thiết bị bán dẫn ASML Holding NV của Hà Lan và Tokyo Electron Ltd. của Nhật Bản tại Trung Quốc.
- Các nhà máy chip của Trung Quốc đang phát triển các chip HBM, bao gồm Wuhan Xinxin Semiconductor Manufacturing Co., một công ty con của Yangtze Memory Technologies Co., Huawei Technologies Co., và ChangXin Memory Technologies Inc.
- Chính quyền Biden đã cố gắng trong nhiều năm để hạn chế khả năng mua và sản xuất các chip bán dẫn tiên tiến của Trung Quốc, nhưng kết quả vẫn chưa đạt được như mong đợi. Mỹ đang tìm kiếm sự hỗ trợ từ các đồng minh để tạo ra một lệnh cấm toàn cầu hiệu quả hơn.
- Estevez dự kiến sẽ lặp lại yêu cầu của Mỹ về việc thắt chặt các hạn chế đối với khả năng bảo trì và sửa chữa thiết bị tiên tiến của ASML và Tokyo Electron tại Trung Quốc.
- Chuyến thăm của phái đoàn Mỹ đến Hà Lan dự kiến sẽ diễn ra sau khi nội các mới của Hà Lan được tuyên thệ vào tuần đầu tiên của tháng 7. Reinette Klever của Đảng Tự do của Geert Wilders dự kiến sẽ trở thành Bộ trưởng Thương mại và Phát triển Ngoại thương.
- Chính phủ Hà Lan và Nhật Bản đã chống lại áp lực từ Mỹ, muốn có thêm thời gian để đánh giá tác động của các lệnh cấm xuất khẩu hiện tại và chờ kết quả của cuộc bầu cử tổng thống Mỹ vào tháng 11.
- Người phát ngôn Bộ Ngoại giao Trung Quốc Lin Jian cho biết Trung Quốc phản đối các nỗ lực của Mỹ nhằm "ép buộc các quốc gia khác đàn áp ngành công nghiệp bán dẫn của Trung Quốc."
- Các chip HBM là một phần không thể thiếu của hệ sinh thái phần cứng AI vì chúng tăng tốc độ truy cập bộ nhớ, giúp phát triển AI. Các bộ tăng tốc AI, được sản xuất bởi Nvidia Corp. và Advanced Micro Devices Inc., cần được kết hợp với các chip HBM để hoạt động.
- SK Hynix Inc. là nhà sản xuất hàng đầu của các chip HBM, với Samsung Electronics Co. và Micron Technology Inc. của Mỹ đang cố gắng bắt kịp. SK Hynix dựa vào thiết bị từ ASML và Tokyo Electron.
- Các nhà sản xuất thiết bị Hàn Quốc như Hanmi Semiconductor Co. và Hanwha Precision Machinery Co. cũng đóng vai trò quan trọng trong chuỗi cung ứng HBM. Washington đã yêu cầu Seoul hạn chế dòng chảy thiết bị và công nghệ sản xuất chip logic và bộ nhớ cao cấp đến Trung Quốc.
- Các công ty Trung Quốc không còn có thể mua các chip AI tiên tiến nhất từ Nvidia, nhưng Huawei đang phát triển các bộ tăng tốc AI của riêng mình, gọi là Ascend. Không rõ công ty nào đang cung cấp các chip bộ nhớ tiên tiến cho Huawei.

📌 Mỹ đang tìm kiếm sự hỗ trợ từ Nhật Bản và Hà Lan để hạn chế tiến bộ của Trung Quốc trong lĩnh vực chip AI, đặc biệt là các chip bộ nhớ băng thông cao. Các cuộc thảo luận sẽ tập trung vào việc áp đặt thêm các hạn chế đối với ASML và Tokyo Electron.

https://www.bloomberg.com/news/articles/2024-06-18/us-to-seek-curbs-on-asml-tokyo-electron-support-for-china-s-ai-memory-chips

Không có file đính kèm.

Nguồn tham khảo

162

AI chips-hardware-compute 2024-06-19 15:14:10

CEO HPE ra mắt phần cứng AI đơn giản hóa việc triển khai AI cho doanh nghiệp

- Tại hội nghị ở Las Vegas, CEO HPE Antonio Neri giới thiệu dòng sản phẩm phần cứng, phần mềm và dịch vụ mới nhằm giúp các doanh nghiệp triển khai các ứng dụng AI một cách dễ dàng.

- Kể từ khi ChatGPT ra mắt năm 2022, các doanh nghiệp đang nỗ lực phát triển và tích hợp AI để tận dụng lượng dữ liệu khổng lồ họ lưu trữ. Tuy nhiên, chip, phần cứng và phần mềm cần thiết để xây dựng và vận hành AI thường phức tạp và rủi ro.

- HPE cho rằng có hàng chục công ty đang xây dựng các mô hình AI tiên tiến và hơn 100 chính phủ quan tâm đến việc xây dựng siêu máy tính và cơ sở hạ tầng điện toán đám mây. Nhưng cơ hội lớn nằm ở việc bán phần cứng AI cho nhóm doanh nghiệp lớn không tập trung vào đẩy ranh giới công nghệ.

- Neri nói rằng thông báo này nhằm đẩy nhanh việc triển khai AI cho phân khúc khách hàng doanh nghiệp, thúc đẩy cuộc cách mạng công nghiệp.

- Hiện tại, mảng kinh doanh AI cho phân khúc này chiếm khoảng 15% doanh thu AI của HPE, phần lớn còn lại đến từ các công ty điện toán đám mây lớn như Amazon và Microsoft.

- HPE sẽ cung cấp máy chủ sử dụng GPU tiên tiến của Nvidia cho tính toán AI, cùng nhiều phần cứng và phần mềm khác. Dòng sản phẩm máy chủ và dịch vụ mới sẽ có mặt vào mùa thu năm nay.

📌 HPE đang nhắm đến cơ hội lớn trong việc cung cấp giải pháp phần cứng, phần mềm và dịch vụ AI đơn giản hóa cho các doanh nghiệp, chiếm 15% doanh thu AI hiện tại của họ. Với việc tung ra dòng sản phẩm mới vào mùa thu, HPE kỳ vọng sẽ thúc đẩy mạnh mẽ việc triển khai AI ở các doanh nghiệp, đẩy nhanh cuộc cách mạng công nghiệp.

https://telecom.economictimes.indiatimes.com/news/enterprise-services/hpe-ceo-unveils-simple-ai-hardware-aimed-to-help-businesses/111099154

Không có file đính kèm.

Nguồn tham khảo

109

AI kiến thức-khóa học AI chips-hardware-compute 2024-06-17 00:41:27

NPU là gì? Cách so sánh thông số kỹ thuật NPU như phần cứng máy tính khác

- NPU (Neural Processing Unit) là bộ xử lý chuyên biệt cho các tác vụ AI và machine learning, giúp xử lý hiệu quả các tác vụ như nhận dạng hình ảnh, bộ lọc video thời gian thực, nhận dạng giọng nói, thực tế tăng cường.
- NPU khác biệt với CPU và GPU. CPU là bộ xử lý đa năng, GPU chuyên xử lý đồ họa và hỗ trợ CPU, còn NPU chuyên xử lý các tính toán song song cấp cao liên quan đến AI với mức tiêu thụ năng lượng thấp hơn.
- Các thông số quan trọng khi so sánh NPU gồm: TOPS (số phép tính mỗi giây), hiệu suất năng lượng (TOPS/W), độ chính xác (8-bit, 16-bit, 32-bit), băng thông bộ nhớ, khả năng tương thích với các framework AI phổ biến.
- NPU mang lại nhiều lợi ích cho laptop và PC như: tăng hiệu năng xử lý AI, kéo dài thời lượng pin, cải thiện trải nghiệm người dùng với các tính năng AI, giảm tải cho CPU/GPU, sẵn sàng cho các ứng dụng AI trong tương lai.

📌 NPU đang thay đổi cách xử lý các tác vụ AI trên các thiết bị hiện đại. Với NPU 40 TOPS như chip Snapdragon X Elite của Qualcomm cho khả năng AI vượt trội hơn NPU 10 TOPS như chip Meteor Lake của Intel. Hiểu rõ và so sánh các thông số kỹ thuật NPU giúp đưa ra quyết định sáng suốt nhằm tối ưu hiệu năng và sẵn sàng cho tương lai với AI ngày càng phổ biến trong cuộc sống hàng ngày.

https://www.makeuseof.com/what-is-npu-how-compare-specs/

Không có file đính kèm.

Nguồn tham khảo

158

AI kiến thức-khóa học AI chips-hardware-compute 2024-06-17 00:17:10

Tìm hiểu về Apple Neural Engine: trái tim của AI trên iPhone và iPad

- Apple Neural Engine (ANE) là bộ phận phần cứng chuyên dụng được giới thiệu lần đầu trên iPhone X và chip A11, nhằm tăng tốc các tác vụ học máy.
- ANE hoạt động cùng với CPU và GPU để thực thi các mô hình học máy hiệu quả hơn, đặc biệt cho các tác vụ đòi hỏi mức tiêu thụ điện năng thấp.
- Học máy liên quan đến việc sử dụng thuật toán và mô hình thống kê để máy tính thực hiện các tác vụ mà không cần lập trình rõ ràng. Nó đòi hỏi huấn luyện với bộ dữ liệu lớn.
- Trong sử dụng hàng ngày, học máy hỗ trợ nhiều ứng dụng như nhiếp ảnh điện toán, phân tích cảnh và ổn định video.
- Core ML là API học máy của Apple, tận dụng CPU, GPU và ANE để đạt hiệu suất tối ưu, cho phép các nhà phát triển tích hợp liền mạch các mô hình học máy vào ứng dụng.
- Hiệu suất của Neural Engine đã được cải thiện đáng kể qua thời gian, từ 11 nghìn tỷ phép tính/giây trên M1, 15.8 nghìn tỷ trên M2/M3, đến 38 nghìn tỷ trên M4 mới nhất.
- ANE hỗ trợ các phép tính dấu phẩy động 16-bit (FP16), được tối ưu hóa cho suy luận thay vì huấn luyện.
- Chiến lược AI của Apple tập trung vào các mô hình AI trên thiết bị và tích hợp đám mây để nâng cao trải nghiệm người dùng với các tính năng như chỉnh sửa văn bản tạo sinh, thông báo cá nhân hóa và tương tác ngôn ngữ tự nhiên.

📌 Apple Neural Engine đóng vai trò then chốt trong việc tăng tốc các tác vụ học máy trên thiết bị Apple. Với khả năng tối ưu hóa hiệu suất và hiệu quả năng lượng ấn tượng lên đến 38 nghìn tỷ phép tính/giây trên chip M4, ANE nâng cao nhiều tính năng từ Face ID đến nhiếp ảnh điện toán, trở thành nền tảng của chiến lược AI tập trung vào xử lý trên thiết bị của Apple.

https://www.geeky-gadgets.com/?p=430149

Không có file đính kèm.

Nguồn tham khảo

160

AI chips-hardware-compute Semi-Cloud-DC-Green 2024-06-15 20:13:35

Mistral AI cảnh báo châu Âu thiếu trung tâm dữ liệu và năng lực đào tạo AI

- Audrey Herblin-Stoop, Trưởng phòng Quan hệ Công chúng tại Mistral AI, cảnh báo châu Âu thiếu các trung tâm dữ liệu để đào tạo các mô hình AI đáp ứng nhu cầu hiện tại.
- Mistral AI đã sử dụng các cơ sở siêu máy tính do Ủy ban châu Âu mở để đào tạo các mô hình của mình.
- Công ty đã công bố mô hình ngôn ngữ lớn mới có tên Mistral Large, cạnh tranh với ChatGPT của OpenAI, thông thạo tiếng Pháp, Anh, Đức, Tây Ban Nha và Ý.
- Đối tác chiến lược của Mistral AI với Microsoft, công ty đang tìm cách đầu tư 15 triệu euro, đang bị Ủy ban châu Âu giám sát.
- Báo cáo của Tòa án Kiểm toán châu Âu (ECA) cảnh báo Ủy ban châu Âu cần đầu tư nhiều hơn vào AI nếu muốn đạt được tham vọng và ngang hàng với Mỹ và Trung Quốc.
- Killian Gross từ Ủy ban châu Âu cho rằng các công ty EU thiếu "sức mạnh tài chính" mà các gã khổng lồ Mỹ như Microsoft có.
- Nghị sĩ Dragoș Tudorache cảnh báo rằng mặc dù Đạo luật AI mang lại tiềm năng hài hòa hóa, các cách tiếp cận của các quốc gia thành viên rất khác nhau về các vấn đề như kỹ năng.
- Mistral AI cần quyền truy cập vào khối lượng lớn dữ liệu bằng các ngôn ngữ như tiếng Ý, Pháp và Tây Ban Nha để đảm bảo hệ thống của họ phù hợp.

📌 Mistral AI nhấn mạnh sự thiếu hụt trung tâm dữ liệu và năng lực đào tạo AI ở châu Âu, cũng như nhu cầu tiếp cận dữ liệu đa dạng ngôn ngữ. Mặc dù Đạo luật AI mang lại tiềm năng hài hòa hóa, các quốc gia thành viên EU vẫn có cách tiếp cận khác nhau. Ủy ban châu Âu cần đầu tư nhiều hơn để bắt kịp Mỹ và Trung Quốc trong lĩnh vực AI.

https://www.euronews.com/next/2024/06/14/mistal-ai-warns-of-lack-of-data-centres-training-capacity-in-europe

Không có file đính kèm.

Nguồn tham khảo

120

AI chips-hardware-compute 2024-06-15 09:20:35

Apple sử dụng trung tâm dữ liệu của Google để tạo AI mới

- Apple đang sử dụng silicon của riêng mình để chạy các tính năng AI mới, nhưng cần Google để huấn luyện các mô hình AI.
- Apple đã yêu cầu quyền truy cập bổ sung vào các TPU của Google để huấn luyện, gây ra một cuộc khủng hoảng kỹ thuật cho nhân viên Google vào tháng 4.
- Nhóm Google đã giải quyết vấn đề sau vài ngày làm việc dài. Apple có biệt danh "Bigfoot" trong số nhân viên Google Cloud vì sử dụng rất nhiều trung tâm dữ liệu của Google.
- Hợp tác cho thấy Apple vẫn đang tụt hậu trong cuộc đua AI tạo sinh. Họ phải dựa nhiều hơn vào các đối thủ cạnh tranh như Microsoft, Google và Amazon.
- Thỏa thuận của Apple với OpenAI sẽ cung cấp cho người dùng quyền truy cập vào ChatGPT, một chatbot tiên tiến hơn so với những gì Apple có thể cung cấp.
- Các cuộc chiến AI đang buộc các công ty công nghệ phải thiết lập các mối quan hệ quan trọng và đôi khi bất ngờ, như thỏa thuận gần đây giữa Microsoft và Oracle.
- Apple đang mở cửa cho các đối tác AI và thậm chí đề cập đến khả năng hợp tác với Google Gemini trong tương lai.

📌 Apple đang phải dựa vào các đối thủ cạnh tranh như Google và OpenAI để bắt kịp cuộc đua AI tạo sinh, cho thấy sự hợp tác bất ngờ giữa các gã khổng lồ công nghệ. Mặc dù sử dụng silicon của riêng mình, Apple vẫn cần trung tâm dữ liệu và chuyên môn của Google để huấn luyện các mô hình AI mới.

https://www.businessinsider.com/apple-ai-google-data-centers-2024-6

Không có file đính kèm.

Nguồn tham khảo

122

Semi-Cloud-DC-Green AI chips-hardware-compute 2024-06-14 17:45:21

Nvidia đã xuất xưởng 3,76 triệu GPU trung tâm dữ liệu trong năm 2023, chiếm 98% thị phần doanh thu

- Nvidia đã xuất xưởng 3,76 triệu GPU trung tâm dữ liệu trong năm 2023, tăng hơn 1 triệu so với năm 2022, tương đương mức tăng trưởng 42%.
- Nvidia giữ vững 98% thị phần GPU trung tâm dữ liệu trong năm 2023, không thay đổi so với năm trước.
- Công ty cũng chiếm 88% thị phần GPU máy tính để bàn, với dòng RTX 50-series dự kiến ra mắt cuối năm nay.
- Nvidia đạt doanh thu kỷ lục 60,9 tỷ USD trong năm 2023, tăng 126% so với năm 2022.
- Mặc dù bị cấm xuất khẩu chip AI và các chip tiên tiến khác sang Trung Quốc, Nvidia vẫn đối mặt với tình trạng thiếu hụt GPU AI do sản lượng của TSMC không đáp ứng kịp nhu cầu.
- TSMC dự đoán Nvidia sẽ trở thành công ty bán dẫn lớn nhất thế giới trong năm 2023. Tính đến quý 1 năm 2024, Nvidia đã đứng thứ ba trong số các công ty có giá trị nhất thế giới và có khả năng sẽ vượt qua Apple sớm.
- AMD đang phát triển các chip tiết kiệm năng lượng hơn, trong khi GPU H100 của Nvidia tiêu thụ 700 watt khi hoạt động hết công suất.
- Intel cũng giới thiệu bộ xử lý AI Gaudi 3 với giá chỉ bằng một nửa so với H100, là lựa chọn hấp dẫn cho các công ty không muốn chi hơn 30.000 USD cho mỗi card H100.
- Các nhà cung cấp trung tâm dữ liệu như Microsoft, Amazon và Google cũng tham gia vào cuộc đua phần cứng trung tâm dữ liệu với các chip tự phát triển.
- Microsoft đã tiết lộ GPU Maia 100 cho các ứng dụng AI và dự kiến sẽ sử dụng trong dự án trung tâm dữ liệu trị giá 100 tỷ USD sắp tới.
- Amazon và Google cũng phát triển các chip riêng cho AWS và các bộ xử lý máy chủ trung tâm dữ liệu của mình.
- Nvidia khẳng định rằng các chip của các công ty khác vẫn chưa mạnh bằng GPU của họ về hiệu suất AI và không linh hoạt bằng.

📌 Nvidia đã xuất xưởng 3,76 triệu GPU trung tâm dữ liệu trong năm 2023, chiếm 98% thị phần doanh thu. Công ty đạt doanh thu kỷ lục 60,9 tỷ USD, tăng 126% so với năm 2022. Nvidia vẫn giữ vị trí dẫn đầu mặc dù có sự cạnh tranh từ AMD, Intel và các nhà cung cấp trung tâm dữ liệu khác.

https://www.tomshardware.com/tech-industry/nvidia-shipped-376m-data-center-gpus-in-2023-dominates-business-with-98-revenue-share

Không có file đính kèm.

Nguồn tham khảo

180

AI chips-hardware-compute Semi-Cloud-DC-Green 2024-06-13 16:54:51

Samsung công bố lộ trình công nghệ chip để giành thị phần kinh doanh AI

- Samsung Electronics công bố nhiều tiến bộ sắp tới trong công nghệ nhằm thu hút các nhà sản xuất chip AI vào hoạt động sản xuất của mình.
- Mặc dù là nhà sản xuất chip nhớ số 1 thế giới, Samsung vẫn đang cố gắng bắt kịp đối thủ TSMC trên thị trường foundry.
- Thị phần của Samsung trong thị trường foundry giảm xuống 11% trong quý 1/2024, trong khi của TSMC tăng lên 61,7%.
- Lợi nhuận của Samsung đang phục hồi nhờ nhu cầu về các thành phần dùng trong hệ thống tính toán AI.
- Samsung phải chứng minh khả năng sản xuất tiên tiến và đáng tin cậy để thu hút cam kết lớn hơn từ các khách hàng như Nvidia.
- Công nghệ tiên tiến được Samsung giới thiệu sử dụng công nghệ mạng phân phối nguồn backside, giúp cải thiện hiệu suất và giảm đáng kể độ sụt áp.
- Samsung dự đoán danh sách khách hàng liên quan đến AI sẽ tăng gấp 5 lần và doanh thu tăng gấp 9 lần so với mức hiện tại vào năm 2028.
- Samsung quảng bá công nghệ gate-all-around (GAA), quan trọng cho các sản phẩm AI, và sẽ sản xuất hàng loạt quy trình 3nm thế hệ thứ hai sử dụng GAA trong nửa cuối năm nay.
- Công ty khẳng định việc chuẩn bị cho quy trình 1.4nm đang diễn ra suôn sẻ, với các mục tiêu về hiệu suất và sản lượng đúng hướng cho sản xuất hàng loạt vào năm 2027.

📌 Samsung đang nỗ lực thu hút các nhà sản xuất chip AI bằng cách công bố lộ trình công nghệ tiên tiến, bao gồm quy trình 3nm GAA thế hệ thứ hai, 2nm GAA và 1.4nm, nhằm tăng thị phần trong thị trường foundry đang bị TSMC thống trị với 61,7%. Công ty kỳ vọng sẽ tăng gấp 5 lần số lượng khách hàng AI và gấp 9 lần doanh thu vào năm 2028.

https://www.bloomberg.com/news/articles/2024-06-12/samsung-unveils-chip-technology-road-map-to-win-ai-business

Không có file đính kèm.

Nguồn tham khảo

122

AI chips-hardware-compute AI benchmark 2024-06-13 07:51:04

Nvidia thống trị các bài kiểm tra AI mới nhất của MLPerf

- Nvidia tiếp tục thống trị nhiều bài kiểm tra chuẩn về học máy, với hai bài kiểm tra mới được bổ sung vào bộ MLPerf.
- Một hệ thống bao gồm 11.616 GPU Nvidia H100 đứng đầu trong cả 9 bài kiểm tra, lập kỷ lục mới ở 5 bài (bao gồm 2 bài mới về tinh chỉnh LLM và mạng nơ-ron đồ thị).
- Hệ thống 11.616 GPU H100 hoàn thành bài kiểm tra huấn luyện GPT-3 trong chưa đầy 3,5 phút, cải thiện 3,2 lần so với năm ngoái.
- Nvidia đạt được khả năng mở rộng tuyến tính, nghĩa là gấp đôi số GPU sẽ giảm một nửa thời gian huấn luyện.
- Các đối thủ như Intel và Google cũng đang tiến gần hơn đến khả năng mở rộng tuyến tính.
- Nvidia cải thiện hiệu suất nhờ các tối ưu hóa phần mềm như điều chỉnh sử dụng số chấm động 8-bit, điều chỉnh ngân sách điện năng, tăng tốc giao tiếp giữa các GPU và áp dụng thuật toán flash attention.
- MLPerf bổ sung hai bài kiểm tra mới về tinh chỉnh LLM và mạng nơ-ron đồ thị để bắt kịp xu hướng trong ngành AI.
- Trong tương lai, AMD, Intel và Nvidia sẽ cạnh tranh gay gắt hơn với các bộ tăng tốc AI mới.

📌 Nvidia tiếp tục thống trị các bài kiểm tra chuẩn về AI của MLPerf với hệ thống 11.616 GPU H100, đạt mức tăng 3,2 lần so với năm ngoái và khả năng mở rộng tuyến tính. Sự cạnh tranh từ Intel, Google và AMD hứa hẹn sẽ gay cấn hơn trong tương lai gần với các bộ tăng tốc AI thế hệ mới.

https://spectrum.ieee.org/mlperf-nvidia-conquers

Không có file đính kèm.

Nguồn tham khảo

136

AI viễn thông AI chips-hardware-compute 2024-06-11 17:08:59

Tương lai của AI và 5G: Các nhà khoa học phát triển chip quang học đầu tiên đa năng, lập trình được

- Nhóm nghiên cứu từ Photonics Research Laboratory (PRL)-iTEAM tại Universitat Politècnica de València, phối hợp với iPRONICS, đã phát triển một chip quang học đột phá.
- Đây là chip đầu tiên trên thế giới có tính năng đa năng, lập trình được, đánh dấu bước tiến quan trọng cho ngành viễn thông, trung tâm dữ liệu và cơ sở hạ tầng điện toán AI.
- Chip này hứa hẹn nâng cao nhiều ứng dụng như truyền thông 5G, điện toán lượng tử, trung tâm dữ liệu, trí tuệ nhân tạo, vệ tinh, máy bay không người lái và xe tự lái.
- Chip cho phép lập trình và kết nối theo yêu cầu các phân đoạn không dây và quang học của mạng truyền thông, tránh tạo ra các nút thắt cổ chai có thể hạn chế cả dung lượng và băng thông.
- Chip có thể thực hiện 12 chức năng cơ bản cần thiết cho các hệ thống này và có thể lập trình theo yêu cầu, từ đó tăng hiệu quả của mạch.
- Các ứng dụng như 5G hay xe tự lái đòi hỏi tần số cao hơn, cần thu nhỏ kích thước ăng-ten và mạch liên quan. PRL-iTEAM đã làm cho bộ chuyển đổi phía sau ăng-ten, một chip giao diện, nhỏ gọn nhất có thể và sẵn sàng hỗ trợ các dải tần số hiện tại và tương lai.
- Chip này đã được tích hợp vào sản phẩm Smartlight của iPRONICS và Vodafone đã sử dụng nó trong thử nghiệm.
- Đối với iPRONICS, phát triển chip này là bước quan trọng vì nó cho phép xác thực các phát triển của họ áp dụng cho một vấn đề ngày càng tăng - quản lý hiệu quả luồng dữ liệu trong trung tâm dữ liệu và mạng cho hệ thống điện toán AI.

📌 Chip quang học đầu tiên trên thế giới có tính năng đa năng, lập trình được và đa chức năng do UPV và iPRONICS phát triển hứa hẹn cải thiện đáng kể hiệu suất của nhiều ứng dụng như 5G, điện toán lượng tử, AI và xe tự lái. Chip cho phép lập trình linh hoạt, tránh nút thắt cổ chai, tăng dung lượng và băng thông của mạng.

https://scitechdaily.com/the-future-of-ai-and-5g-scientists-develop-the-first-universal-programmable-and-multifunctional-photonic-chip/

Không có file đính kèm.

Nguồn tham khảo

119

AI chips-hardware-compute 2024-06-11 16:29:30

Quyền lực chính trị và GPU: Thách thức của Nvidia trong cuộc đua AI

- Tại triển lãm Computex ở Đài Loan, CEO của Nvidia, Jensen Huang, đã nhấn mạnh vào việc tập trung thiết kế các chip tốt nhất và cung cấp cơ sở hạ tầng cho cuộc cách mạng AI.
- Tuy nhiên, Nvidia đã đi quá xa trên con đường phát triển phần mềm, gây ra nguy cơ mất tập trung và cạnh tranh với các khách hàng lớn nhất của họ.
- Các hyperscaler đều nhận thức rõ sự phụ thuộc của họ vào Nvidia và đang thiết kế các bộ tăng tốc AI của riêng mình để giảm sự phụ thuộc này.
- Nvidia không có đủ chip để đáp ứng nhu cầu, điều này có nghĩa là họ nắm giữ quyền lực trong tất cả các cuộc đàm phán.
- Các hyperscaler cũng đang cố gắng làm suy yếu các rào cản phần mềm của Nvidia, buộc công ty phải tăng cường đầu tư vào phần mềm để củng cố sự khác biệt của mình.
- Nvidia có nhiều lựa chọn tuyệt vời để tiến về phía trước, nhưng họ không thể quay trở lại chỉ là một nhà cung cấp bán dẫn đơn thuần.

📌 Nvidia đang ở vị thế mạnh mẽ trong cuộc đua AI, nhưng động lực thị trường và nhận thức của các đối thủ cạnh tranh đã hạn chế các lựa chọn của công ty. Việc tập trung vào phần cứng có thể là chiến lược tối ưu, nhưng Nvidia không thể từ bỏ tham vọng phần mềm và chỉ trở thành nhà cung cấp chip thuần túy.

https://www.techspot.com/news/103320-opinion-power-politics-gpus.html

Không có file đính kèm.

Nguồn tham khảo

100

AI chips-hardware-compute 2024-06-08 07:25:11

Huawei tuyên bố chip AI vượt trội hơn Nvidia giữa nỗ lực tự cung tự cấp của Trung Quốc

- Một giám đốc điều hành của Huawei cho biết chip AI Ascend 910B của công ty đã vượt qua chip A100 của Nvidia trong một số bài kiểm tra, đạt 80% hiệu suất khi huấn luyện các mô hình ngôn ngữ lớn, thậm chí vượt trội hơn 20% trong một số bài kiểm tra khác.
- Nhận xét này cho thấy Huawei đang phát triển nhanh chóng trong thị trường do Nvidia thống trị, đồng thời đóng vai trò quan trọng trong nỗ lực tự cung tự cấp của Trung Quốc khi Nvidia không thể xuất khẩu GPU tiên tiến do các hạn chế của Mỹ.
- Huawei giới thiệu dòng chip Ascend từ năm 2019, tập trung xây dựng hệ sinh thái phần mềm và phần cứng độc quyền để phục vụ khách hàng trong nước.
- Hệ sinh thái Ascend hiện có 40 đối tác phần cứng, 1.600 đối tác phần mềm và 2.900 giải pháp ứng dụng AI.
- Mặc dù chip Ascend 910B của Huawei kém hơn về mặt công nghệ so với GPU mới nhất của Nvidia, nhưng chúng đã trở thành lựa chọn hàng đầu cho các công ty Trung Quốc hoạt động trong lĩnh vực AI.
- Các gã khổng lồ công nghệ Trung Quốc như Tencent, Baidu và các startup hàng đầu như iFlyTek đã mua chip 910B.
- Huawei vận hành các cụm máy tính chạy trên chip Ascend tại 19 thành phố trên khắp Trung Quốc và có kế hoạch mở rộng ra các thủ phủ tỉnh lớn khác.

📌 Chip AI Ascend 910B của Huawei đã cho thấy khả năng cạnh tranh mạnh mẽ với chip A100 của Nvidia, đánh dấu bước tiến quan trọng trong nỗ lực tự cung tự cấp công nghệ AI của Trung Quốc. Với hệ sinh thái phần cứng và phần mềm đang phát triển nhanh chóng, Huawei đang trở thành lựa chọn hàng đầu cho các công ty trong nước, bất chấp những hạn chế về công nghệ so với đối thủ Mỹ.

https://www.scmp.com/tech/big-tech/article/3265640/huawei-says-its-ai-chip-better-nvidias-a100-amid-chinas-self-reliance-drive

Không có file đính kèm.

Nguồn tham khảo

123

AI chips-hardware-compute 2024-06-06 23:18:27

Saudi Arabia khởi động tham vọng thiết kế chip với trung tâm mới

- Saudi Arabia ra mắt Trung tâm Bán dẫn Quốc gia nhằm phát triển các công ty thiết kế chip fabless.
- Mục tiêu thu hút 50 công ty đến vương quốc vào năm 2030, tập trung vào các chip đơn giản thay vì công nghệ tiên tiến và nhạy cảm về chính trị.
- Sản xuất sẽ được thực hiện ở nước ngoài, ít nhất là trong trung hạn.
- Sáng kiến này nhấn mạnh tầm quan trọng ngày càng tăng của bán dẫn đối với Saudi Arabia khi Thái tử Mohammed bin Salman tìm cách khai thác các ngành công nghiệp mới để đa dạng hóa nền kinh tế.
- Vương quốc đang cạnh tranh để trở thành người dẫn đầu khu vực về công nghệ tiên tiến, với hy vọng tạo ra các trung tâm dữ liệu, công ty AI và sản xuất bán dẫn.
- Alat, một công ty đầu tư được hỗ trợ bởi 100 tỷ USD từ quỹ đầu tư quốc gia, được ra mắt vào tháng 2 với nhiệm vụ đầu tư vào việc xây dựng các trung tâm sản xuất mới và tìm kiếm đối tác cho bán dẫn.
- Mỹ đã yêu cầu Saudi Arabia lựa chọn giữa công nghệ Trung Quốc và Mỹ khi xây dựng ngành công nghiệp bán dẫn trong nước.
- Trung tâm mới sẽ cung cấp 10 ưu đãi cho các công ty muốn bắt đầu hoạt động tại đây, bao gồm tiếp cận vốn thông qua quỹ mới trị giá 1 tỷ Riyal (267 triệu USD).

📌 Saudi Arabia đang tích cực phát triển ngành công nghiệp bán dẫn với việc ra mắt Trung tâm Bán dẫn Quốc gia, nhằm thu hút 50 công ty thiết kế chip fabless đến năm 2030. Tập trung vào chip đơn giản và sản xuất quốc tế, sáng kiến này thể hiện tầm quan trọng của bán dẫn trong nỗ lực đa dạng hóa nền kinh tế của vương quốc.

https://www.bloomberg.com/news/articles/2024-06-05/saudi-arabia-s-chip-design-ambitions-take-shape-with-new-hub

Không có file đính kèm.

Nguồn tham khảo

109

AI chips-hardware-compute 2024-06-06 23:08:21

GPU và FPGA: sự khác biệt, ưu điểm và ứng dụng phổ biến

- GPU (graphics processing unit) và FPGA (field programmable gate array) là hai trong ba loại bộ xử lý chính cho xử lý hình ảnh và tính toán nặng, bên cạnh CPU (central processing unit).

- FPGA là mạch tích hợp có thể được lập trình lại để hoạt động như một mạch khác. Nó linh hoạt thích ứng với các thuật toán học máy cụ thể.

- GPU ban đầu được thiết kế để render đồ họa và video. Khả năng xử lý song song giúp GPU phổ biến trong các ứng dụng học sâu.

- FPGA có thể được lập trình để hoạt động như GPU, ASIC hoặc các cấu hình khác. Chúng có thể được tối ưu cho các thuật toán cụ thể.

- GPU gồm nhiều nhân, mỗi nhân có thể thực hiện hàng ngàn phép tính đồng thời. Kiến trúc song song giúp GPU xử lý nhanh các phép tính toán học phức tạp.

- FPGA nổi bật về độ trễ thấp và tiêu thụ điện năng thấp khi được tinh chỉnh cho các tác vụ nhất định. Các kỹ sư có thể triển khai các bộ tăng tốc phần cứng tùy chỉnh.

- Các trường hợp sử dụng phổ biến của FPGA: Tăng tốc HPC, xử lý tín hiệu thời gian thực, tối ưu mạng, giao dịch tần suất cao, ứng dụng hàng không vũ trụ và quốc phòng.

- Các trường hợp sử dụng phổ biến của GPU: Học máy và học sâu, khai thác tiền điện tử, các ứng dụng HPC như mô phỏng khoa học, dự báo thời tiết.

- Có thể dùng FPGA như GPU nhưng cần có chuyên môn thiết kế FPGA và hiểu sâu về kiến trúc GPU. FPGA có thể không đạt hiệu năng và tiêu thụ điện như GPU chuyên dụng.

📌 Lựa chọn giữa GPU và FPGA phụ thuộc vào tính chất ứng dụng, yêu cầu hiệu năng, hạn chế công suất và ngân sách. GPU phổ biến và hiệu quả chi phí cho nhiều tác vụ HPC. FPGA là giải pháp tùy biến và tiết kiệm điện cho các ứng dụng đòi hỏi tăng tốc phần cứng và xử lý thời gian thực.

https://www.techspot.com/news/103228-gpus-vs-fpgas-what-difference.html

Không có file đính kèm.

Nguồn tham khảo

130

AI chips-hardware-compute 2024-06-06 02:52:11

NeevCloud tham gia cuộc đua đám mây AI ở Ấn Độ với 40.000 GPU

- NeevCloud, một startup do Narendra Sen thành lập, đang xây dựng cơ sở hạ tầng đám mây AI với 40.000 GPU cho khách hàng Ấn Độ vào năm 2026.
- Công ty sẽ sớm ra mắt nền tảng suy luận AI cung cấp các mô hình nguồn mở như Llama 3, Mistral và DBRX. Phiên bản beta sẽ ra mắt trong tháng này.
- NeevCloud đã đặt hàng 8.000 GPU NVIDIA từ HPE, dự kiến nhận vào nửa cuối năm nay. Công ty cũng có kế hoạch triển khai GPU của AMD và Groq.
- Tổng chi phí cho 40.000 GPU ước tính khoảng 1,5 tỷ USD. NeevCloud hợp tác với các đối tác trung tâm dữ liệu để hỗ trợ mua và triển khai GPU theo mô hình chia sẻ doanh thu.
- NeevCloud sẽ cạnh tranh trực tiếp với Yotta, E2E Network, Krutrim và Tata Communications trong lĩnh vực cơ sở hạ tầng AI.
- Sen cũng điều hành Rackbank Datacenters ở Indore, sử dụng công nghệ làm mát chìm lỏng Varuna cho phần cứng điện toán hiệu năng cao.

📌 NeevCloud đặt mục tiêu triển khai 40.000 GPU vào năm 2026 với chi phí ước tính 1,5 tỷ USD, cạnh tranh với các đối thủ như Yotta trong thị trường đám mây AI đang phát triển nhanh tại Ấn Độ. Công ty sẽ hợp tác với các đối tác trung tâm dữ liệu và sớm ra mắt nền tảng suy luận AI với các mô hình nguồn mở.

https://analyticsindiamag.com/another-indian-startup-entering-ai-cloud-space-40000-gpus/

Không có file đính kèm.

Nguồn tham khảo

133

AI chips-hardware-compute 2024-06-06 02:17:50

Liệu Nvidia có đang trở thành chuẩn thực tế (de factor) mainframe của thời đại AI?

- Doanh thu của Nvidia tăng gấp đôi trong 3 quý gần đây nhờ vào sự bùng nổ của AI. Công ty đã đặt cược vào HPC và AI từ 15 năm trước.

- Nvidia không chỉ dẫn đầu về phần cứng AI mà còn xây dựng cả một hệ sinh thái phần mềm khép kín với CUDA, các thư viện, công cụ phát triển, microservice. Điều này tạo rào cản cao cho các nhà phát triển muốn chuyển sang nền tảng khác.

- CUDA ra đời năm 2006, trở thành chuẩn mực cho lập trình song song trên GPU. Năm 2012, mạng CNN AlexNet sử dụng CUDA đạt kết quả vượt trội, đưa CUDA lên tầm cao mới.

- Sự ra đời của mô hình Transformer năm 2017 giúp AI tạo sinh trở nên khả thi. Nvidia đã sẵn sàng đón đầu xu hướng này với siêu máy tính DGX.

- Ngoài CUDA, Nvidia còn cung cấp nhiều tầng phần mềm khác như RAPIDS, NeMo, NIMs, tích hợp trong gói Nvidia AI Enterprise. Mô hình kinh doanh này có nhiều nét tương đồng với mainframe ngày xưa.

- Các đối thủ như AMD, Intel, Apple, Google đang tìm cách cạnh tranh nhưng vẫn thua kém Nvidia một khoảng cách đáng kể về mặt hệ sinh thái. Tuy nhiên, họ vẫn có cơ hội khi thị trường AI đa dạng hóa.

📌 Nvidia đang thống trị thị trường cả về phần cứng lẫn phần mềm AI với hệ sinh thái khép kín tương tự như mainframe. Mặc dù có nhiều đối thủ mạnh, Nvidia vẫn tạo được rào cản cao nhờ sự chín muồi của nền tảng CUDA và các tầng phần mềm. Tuy nhiên, khi thị trường AI đa dạng hóa, các đối thủ vẫn có cơ hội cạnh tranh ở những phân khúc nhỏ hơn.

https://siliconangle.com/2024/06/05/nvidia-becoming-de-facto-ai-mainframe/

Không có file đính kèm.

Nguồn tham khảo

103

AI chips-hardware-compute 2024-06-05 05:58:49

Intel Lunar Lake NPU mang sức mạnh 48 TOPS, đốt nóng cuộc đua chip AI

- Intel công bố chi tiết về bộ xử lý Lunar Lake thế hệ tiếp theo, cho phép hiệu suất AI trên PC với:
+ Công suất hệ thống giảm 40% và khả năng tính toán AI tăng hơn 3 lần so với thế hệ trước.
+ NPU với tốc độ lên đến 48 nghìn tỷ phép tính mỗi giây (TOPS).
+ Thiết kế GPU mới với các lõi Xe2 GPU và mảng Xe Matrix Extension, bộ tăng tốc AI thứ hai với tốc độ lên đến 67 TOPS.
- Lunar Lake sẽ xuất hiện trên các PC AI từ hơn 20 thương hiệu, bao gồm cả Microsoft, trong suốt năm 2024.
- Lunar Lake cạnh tranh với Snapdragon X Elite của Qualcomm, dòng AI 300 của AMD, M4 của Apple và ngày càng nhiều chip được thiết kế để làm cho AI tạo sinh hoạt động trên PC.
- Bộ kit chuẩn gồm 8 bộ tăng tốc AI Gaudi 2 và bo mạch nền phổ thông sẽ có giá 65.000 USD cho các nhà cung cấp hệ thống. Gaudi 2 đang được giao hàng.
- Bộ kit gồm 8 bộ tăng tốc AI Gaudi 3 và bo mạch nền phổ thông sẽ có giá 125.000 USD, dự kiến ra mắt trong quý 2/2024.
- Bộ xử lý Intel Xeon 6 P-core (mã Sierra Forest) đã có sẵn từ ngày 3/6, phù hợp cho AI, điện toán hiệu năng cao và ứng dụng cloud-native.
- Bộ xử lý Xeon 6 E-core (mã Granite Rapids) có mật độ lõi cao hơn, hiệu suất trên mỗi watt tốt hơn và chi phí năng lượng thấp hơn, dự kiến giao hàng trong quý 3/2024.

📌 Intel đang đẩy mạnh cuộc đua phát triển chip AI với bộ xử lý Lunar Lake 48 TOPS, cạnh tranh trực tiếp với Qualcomm, AMD, Apple. Hãng cũng công bố giá cho bộ kit Gaudi 2 và 3, đồng thời ra mắt dòng Xeon 6 mới với phiên bản P-core và E-core, hứa hẹn mang lại hiệu năng vượt trội cho các ứng dụng AI và điện toán đám mây trong tương lai gần.

https://www.techrepublic.com/article/intel-lunar-lake-npu/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2024-06-05 05:54:56

Chi phí đào tạo các mô hình AI ngày càng tăng vọt

- Đồ họa bong bóng cho thấy chi phí đào tạo các mô hình AI tăng theo thời gian, dựa trên phân tích từ Báo cáo Chỉ số Trí tuệ Nhân tạo 2024 của Đại học Stanford.
- Việc đào tạo các mô hình AI tiên tiến như ChatGPT của OpenAI và Gemini Ultra của Google đòi hỏi hàng triệu USD, với chi phí leo thang nhanh chóng.
- Các yếu tố chính được phân tích bao gồm thời gian đào tạo mô hình, tỷ lệ sử dụng phần cứng và giá trị của phần cứng đào tạo.
- Năm 2017, chi phí đào tạo mô hình Transformer là 930 USD. Đến năm 2023, GPT-4 của OpenAI có chi phí ước tính là 78.4 triệu USD.
- Mô hình Gemini Ultra của Google còn tốn kém hơn, lên tới 191 triệu USD. Tính đến đầu năm 2024, mô hình này vượt trội hơn GPT-4 trên một số chỉ số, đặc biệt là trên bài kiểm tra MMLU.
- Các công ty AI đang tìm ra các giải pháp mới để đào tạo mô hình ngôn ngữ nhằm chống lại chi phí ngày càng tăng, như tạo ra các mô hình nhỏ hơn được thiết kế để thực hiện các tác vụ cụ thể hoặc thử nghiệm tạo dữ liệu tổng hợp của riêng họ.
- Tuy nhiên, các mô hình AI sử dụng dữ liệu tổng hợp đã cho thấy sản sinh ra vô nghĩa khi được hỏi với một số lời nhắc nhất định, gây ra "sụp đổ mô hình".

📌 Chi phí đào tạo các mô hình AI tiên tiến đã tăng vọt, từ 930 USD cho Transformer năm 2017 lên tới 191 triệu USD cho Gemini Ultra của Google năm 2024. Các công ty đang tìm cách giảm chi phí bằng các phương pháp như tạo mô hình nhỏ hơn hoặc sử dụng dữ liệu tổng hợp, nhưng chưa có bước đột phá rõ ràng.

https://www.visualcapitalist.com/training-costs-of-ai-models-over-time/

Không có file đính kèm.

Nguồn tham khảo

144

AI chips-hardware-compute 2024-06-05 05:25:10

Đẩy nhanh AI: Sự trỗi dậy của chip AI, GPU không đồng nghĩa với sự kết thúc của CPU

- Chip GPU của Nvidia chiếm hơn 80% thị trường chip AI. Chip Hopper ra mắt năm 2022 đã vượt trội trong mọi hạng mục từ phân loại hình ảnh đến nhận dạng giọng nói trên bài kiểm tra MLPerf. Chip Blackwell mới hứa hẹn nhanh hơn Hopper vài lần nhờ sức mạnh xử lý và khả năng giao tiếp giữa các chip tốt hơn.

- Sự phát triển của phần cứng đang cố gắng bắt kịp và hỗ trợ cuộc cách mạng AI. Nhiều tiến bộ trong AI 10 năm qua đến từ nguyên tắc đơn giản là càng lớn càng tốt. Các mô hình ngôn ngữ lớn như GPT-4 của OpenAI được huấn luyện trên bộ dữ liệu ngày càng lớn, đòi hỏi sức mạnh tính toán khổng lồ, gấp 100 lần so với mô hình tiền nhiệm.

- Các công ty như Meta xây dựng trung tâm dữ liệu dựa trên GPU của Nvidia. Google, IBM và nhiều công ty khác thiết kế chip AI riêng. Các nhà nghiên cứu đang thử nghiệm nhiều thiết kế chip, bao gồm cả tối ưu hóa cho thiết bị nhỏ. Khi AI vượt ra ngoài trung tâm điện toán đám mây và đi vào thiết bị di động, GPU không còn đủ.

- Sự chuyển đổi từ CPU sang GPU đã thúc đẩy cuộc cách mạng deep learning. GPU xử lý nhiều lệnh song song nhanh hơn CPU tuần tự. Để huấn luyện mô hình GPT-3 với 175 tỷ tham số, các nhà nghiên cứu OpenAI phải chạy 1.024 GPU liên tục trong 1 tháng với chi phí hàng triệu USD. Tổng cộng, các GPU đó đã thực hiện 10^23 phép tính, nhanh hơn hàng trăm đến hàng nghìn lần so với CPU.

- Ngoài GPU, các loại chip AI khác bao gồm FPGA (lập trình được), TPU (đơn vị xử lý tensor của Google), chip AI di động. Chúng sử dụng các thủ thuật như tính toán song song, bộ nhớ truy cập nhanh, định dạng số rút gọn để tăng tốc. FPGA linh hoạt như hộp Lego, có thể lập trình mạch theo bất kỳ thiết kế nào. Chip AI di động giúp xử lý các tác vụ AI trên điện thoại mà không cần gửi dữ liệu lên đám mây.

- Tiêu thụ điện năng là mối quan tâm lớn. Huấn luyện GPT-3 ước tính tiêu tốn 1.300 MWh, bằng lượng điện hộ gia đình Anh dùng trong 1 năm. Ngay cả sau khi huấn luyện, sử dụng ứng dụng AI cũng tốn rất nhiều năng lượng. Mặc dù tiến bộ trong thiết kế chip có thể cải thiện hiệu quả, chi phí năng lượng của AI tiếp tục tăng hàng năm khi mô hình ngày càng lớn.

- Sự trỗi dậy của chip AI không đồng nghĩa với sự kết thúc của CPU. Ngược lại, ranh giới giữa các loại chip cơ bản đang mờ dần. CPU hiện đại tính toán song song tốt hơn trước, GPU đa năng hơn. Siêu máy tính mạnh nhất thế giới Frontier dựa trên sự kết hợp của CPU và GPU.

- Tương lai chip AI khó đoán, có thể bao gồm chip quang học dùng ánh sáng thay electron hay chip lượng tử. Giúp công chúng hiểu về phần cứng AI sẽ giúp họ nhận ra AI không phải phép thuật toàn năng. Tất cả chỉ là dây và electron, không thể thống trị thế giới. Các chuyên gia hy vọng phần cứng sẽ tiếp tục cải tiến, qua đó thúc đẩy các ứng dụng AI trong khoa học.

📌 Chip GPU và các loại chip chuyên biệt khác đang đẩy nhanh sự phát triển của AI với khả năng tính toán song song khổng lồ, đáp ứng nhu cầu ngày càng tăng. Tuy nhiên, việc huấn luyện các mô hình AI lớn như GPT-3, GPT-4 đòi hỏi nguồn tài nguyên tính toán và điện năng khổng lồ, với chi phí lên đến hàng triệu USD. Công nghệ chip AI đang phát triển nhanh chóng với nhiều hướng tiềm năng như chip quang học, lượng tử. Tương lai khó đoán định, nhưng việc giúp công chúng hiểu rõ hơn về phần cứng AI sẽ xóa bỏ quan niệm sai lầm cho rằng AI là phép thuật toàn năng.

https://www.nature.com/articles/d41586-024-01544-0

#NATURE

Không có file đính kèm.

Nguồn tham khảo

103

AI chips-hardware-compute 2024-06-03 23:30:36

Jensen Huang của Nvidia công bố lộ trình GPU tăng tốc và tập trung vào GenAI tại Computex 2024

- Jensen Huang, CEO của Nvidia, đã phát biểu khai mạc tại Computex 2024, tập trung vào cách mạng GenAI và lộ trình GPU tăng tốc của Nvidia.
- Huang công bố lộ trình sản phẩm của Nvidia đến năm 2027 với sự ra mắt của nền tảng Rubin, sự phát triển tiếp theo sau Blackwell. Nhà thiên văn học người Mỹ Vera Rubin sẽ là người bảo trợ cho kiến trúc GPU thế hệ tiếp theo của Nvidia.
- Trong khi những thay đổi lớn về kiến trúc có thể tiếp tục diễn ra 2 năm một lần, Nvidia hiện đang chuyển sang thực hiện các cải tiến sản phẩm GPU quan trọng hàng năm.
- Lộ trình bao gồm: Blackwell, Blackwell Ultra, Rubin và Rubin Ultra.
- Nvidia đang đẩy mạnh phần mềm và dịch vụ với nền tảng CUDA và NIM (Nvidia Inference Microservices), hiện đã có sẵn. NIM xây dựng trên CUDA và gói gọn tất cả các thành phần phần mềm cần thiết để xây dựng và kích hoạt các ứng dụng AI trên các lĩnh vực cụ thể vào các container được xây dựng sẵn.
- Nvidia gần đây đã hợp tác với các công ty phần cứng doanh nghiệp lớn như Dell Technologies, Lenovo, HPE và những công ty khác để mở rộng tầm với của các công cụ phần mềm của họ.
- Có nhiều đồn đoán rằng Nvidia có ý định tham gia thị trường AI PC với một SoC được cung cấp bởi Arm, có thể được xây dựng cùng với Mediatek. Nếu điều này xảy ra, nó có thể có tác động lớn đến thị trường đang trở nên đông đúc cho các nhà cung cấp chip PC.
- Huang kết thúc bài phát biểu với một cuộc thảo luận hướng tới tương lai về robotics được cung cấp bởi AI và vai trò quan trọng mà ông tin rằng chúng có thể đóng nhờ nền tảng Omniverse của Nvidia.

📌 Tại Computex 2024, Jensen Huang đã công bố lộ trình GPU tăng tốc của Nvidia đến năm 2027, bao gồm Blackwell, Blackwell Ultra, Rubin và Rubin Ultra. Nvidia cũng đang đẩy mạnh phần mềm và dịch vụ với CUDA và NIM, đồng thời hợp tác với các công ty phần cứng doanh nghiệp lớn. Huang cũng đề cập đến khả năng Nvidia tham gia thị trường AI PC và tầm nhìn về robotics được cung cấp bởi AI với nền tảng Omniverse.

https://www.techspot.com/news/103227-nvidia-jensen-huang-kicks-off-computex-2024-spotlight.html

Không có file đính kèm.

Nguồn tham khảo

114

AI chips-hardware-compute 2024-06-03 23:27:27

Nvidia công bố nền tảng AI thế hệ tiếp theo Rubin cho năm 2026, với kế hoạch nâng cấp hàng năm

- Nvidia dự kiến nâng cấp bộ tăng tốc AI hàng năm, công bố chip Blackwell Ultra cho năm 2025 và nền tảng thế hệ tiếp theo Rubin cho 2026.
- Công ty cũng giới thiệu các công cụ và mô hình phần mềm mới trước thềm triển lãm Computex ở Đài Loan.
- Nvidia coi sự trỗi dậy của AI tạo sinh là một cuộc cách mạng công nghiệp mới và kỳ vọng đóng vai trò lớn khi công nghệ chuyển sang máy tính cá nhân.
- Huang kỳ vọng nhiều công ty và cơ quan chính phủ sẽ áp dụng AI, từ các nhà đóng tàu đến các nhà phát triển dược phẩm. Ông nhấn mạnh rằng những ai không có khả năng AI sẽ bị bỏ lại phía sau.
- Nền tảng Rubin sắp tới sẽ sử dụng HBM4, thế hệ tiếp theo của bộ nhớ băng thông cao, vốn đang là nút thắt cổ chai trong sản xuất bộ tăng tốc AI.
- Nvidia đang cung cấp các công cụ và mô hình AI được huấn luyện sẵn để giúp các nhà phát triển phần mềm mang lại nhiều tính năng mới cho PC.
- Nvidia đang phát hành một thiết kế mới cho máy chủ được xây dựng trên chip của họ, gọi là chương trình MGX, giúp các công ty như HPE và Dell đưa sản phẩm ra thị trường nhanh hơn.
- Các sản phẩm đã công bố trước đó như Spectrum X cho mạng và NIM (Nvidia Inference Microservices) hiện đã có sẵn rộng rãi và được áp dụng rộng rãi.
- Huang cũng quảng bá việc sử dụng "digital twins" trong thế giới ảo mà Nvidia gọi là Ominverse, cho thấy quy mô có thể thông qua một digital twin của Trái đất, gọi là Earth 2.

📌 Nvidia đang đẩy mạnh kế hoạch nâng cấp nền tảng AI hàng năm với chip Blackwell Ultra 2025 và Rubin 2026, đồng thời mở rộng sang thị trường PC và cung cấp các công cụ, mô hình AI mới. Công ty kỳ vọng AI tạo sinh sẽ là cuộc cách mạng công nghiệp tiếp theo và những ai không áp dụng sẽ tụt hậu. Các sản phẩm mới như MGX, Spectrum X, NIM đang được triển khai rộng rãi, hứa hẹn giúp tiết kiệm 98% chi phí và 97% năng lượng so với công nghệ truyền thống.

https://www.bloomberg.com/news/articles/2024-06-02/jensen-huang-computex-keynote-nvidia-reveals-new-ai-software-and-services

Không có file đính kèm.

Nguồn tham khảo

154

AI chips-hardware-compute 2024-06-03 23:24:19

AMD ra mắt chip Ryzen AI thế hệ mới, hiệu năng AI tạo sinh vượt trội

- AMD công bố dòng chip xử lý laptop thế hệ mới cho các tác vụ AI tạo sinh tại Computex 2024: Ryzen AI 300 Series, đổi tên từ dòng Ryzen 9 cao cấp nhất.
- Quy ước đặt tên mới vẫn giữ hậu tố HX, nhưng không còn chỉ mức tiêu thụ điện năng mà đại diện cho chip Ryzen AI 300 tốt nhất, nhanh nhất.
- Ryzen AI 300 Series được xây dựng trên các kiến trúc mới nhất của AMD: XDNA2 cho NPU, RDNA 3.5 cho iGPU (lên đến 16 đơn vị tính toán) và Zen 5 cho CPU.
- Hai chip đầu tiên là Ryzen AI 9 HX 370 và Ryzen AI 9 365, đều có NPU 50 TOPS, trong đó bản HX là cao cấp hơn.
- Ryzen AI 9 HX 370: 12 nhân/24 luồng, xung nhịp tối đa 5.1GHz, 36MB cache, đồ họa Radeon 890M.
- Ryzen AI 9 365: 10 nhân/12 luồng, xung nhịp tối đa 5.0GHz, 34MB cache, đồ họa Radeon 880M.
- Ryzen AI 9 300 Series có vẻ sở hữu TOPS cao nhất so với các chip NPU khác trên thị trường: Snapdragon X của Qualcomm (45 TOPS), M4 của Apple (38 TOPS), Ryzen 8040 thế hệ trước của AMD (16 TOPS), Intel Meteor Lake Ultra 7 165H (khoảng 10 TOPS).
- NPU XDNA2 của AMD có khả năng tính toán gấp 5 lần và hiệu quả năng lượng gấp đôi so với thế hệ trước nhờ kiến trúc "khối" FP16 độc đáo, có thể xử lý cả tác vụ AI 8-bit (INT8) và 16-bit (FP16) mà không cần định lượng, giúp xử lý nhanh và chính xác.
- Từ tháng 7/2024, Ryzen AI 300 sẽ có mặt trên một số laptop Copilot Plus như Asus Vivobook S 15, HP OmniBook, cùng nhiều mẫu laptop AI khác từ MSI, Asus, Lenovo.

📌 Ryzen AI 300 Series đánh dấu bước tiến mới của AMD trong cuộc đua chip AI, với kiến trúc NPU tiên tiến cho khả năng xử lý tác vụ AI tạo sinh vượt trội, lên đến 50 TOPS, gấp 5 lần thế hệ trước. Dòng chip mới sẽ xuất hiện trên nhiều mẫu laptop cao cấp từ tháng 7, hứa hẹn mang đến trải nghiệm AI tạo sinh mạnh mẽ cho người dùng.

https://www.theverge.com/2024/6/2/24168951/amd-ryzen-ai-9-300-series-hx-laptop-processors

Không có file đính kèm.

Nguồn tham khảo

191

AI chips-hardware-compute 2024-06-03 05:26:53

Tại sao cơ sở hạ tầng AI quan trọng cần được coi là tài sản công cộng thiết yếu?

- Cơ sở hạ tầng AI quan trọng bao gồm các thành phần chính như mô hình ngôn ngữ lớn (ví dụ GPT-3 của OpenAI), tập dữ liệu khổng lồ để huấn luyện các mô hình này và phần cứng máy tính chuyên dụng để triển khai chúng.
- Chi phí để phát triển các mô hình ngôn ngữ lớn hiện đại có thể lên tới hàng trăm triệu USD. Chỉ một số ít các công ty công nghệ lớn như Google, Meta, Microsoft mới có đủ nguồn lực tài chính và kỹ thuật để xây dựng chúng.
- Sự tập trung quyền kiểm soát cơ sở hạ tầng AI vào tay một vài công ty có thể gây ra nhiều hệ lụy tiêu cực. Nó tạo ra rào cản gia nhập rất lớn cho các công ty mới và làm giảm động lực cạnh tranh, đổi mới. Điều này cuối cùng có thể dẫn tới sự thống trị thị trường và ảnh hưởng xã hội quá lớn của các công ty công nghệ.
- Để giải quyết vấn đề trên, cơ sở hạ tầng AI thiết yếu cần được coi là một dạng tài sản công cộng, tương tự như các loại cơ sở hạ tầng vật lý truyền thống như đường cao tốc, cầu cống, lưới điện...
- Chính phủ cần đóng vai trò dẫn dắt trong việc đầu tư phát triển một nền tảng cơ sở hạ tầng AI mở, có thể truy cập và sử dụng rộng rãi bởi các tổ chức nghiên cứu, trường đại học, startup và công ty nhỏ.
- Bên cạnh đó, các tổ chức phi lợi nhuận, viện nghiên cứu hàng đầu cũng nên tích cực tham gia vào nỗ lực này vì mục tiêu phục vụ lợi ích chung của xã hội, thay vì các động cơ thương mại như các công ty tư nhân.
- Một cơ sở hạ tầng AI mở và phổ biến sẽ giúp thúc đẩy đổi mới, tạo ra một sân chơi bình đẳng hơn cho các doanh nghiệp nhỏ và vừa, qua đó làm tăng cạnh tranh và đa dạng hóa thị trường công nghệ.

📌 Cơ sở hạ tầng AI đóng vai trò nền tảng cho sự phát triển của ngành công nghiệp trí tuệ nhân tạo. Tuy nhiên, chi phí phát triển cực lớn tới hàng trăm triệu USD khiến chỉ các công ty công nghệ hàng đầu mới có thể xây dựng chúng, dẫn tới nguy cơ tập trung quyền lực và thống trị thị trường. Vì vậy, chính phủ và các tổ chức phi lợi nhuận cần chủ động đầu tư xây dựng một cơ sở hạ tầng AI mở, có thể truy cập rộng rãi như một loại tài sản công cộng thiết yếu. Điều này sẽ thúc đẩy đổi mới, cạnh tranh bình đẳng và đa dạng hóa thị trường AI.

https://seekingalpha.com/article/4696897-critical-ai-infrastructure-case

Không có file đính kèm.

Nguồn tham khảo

129

AI chips-hardware-compute 2024-06-01 06:37:21

Chip AI sẽ thay thế GPU, ngay cả Nvidia cũng phải chuyển hướng

- Chip AI có kiến trúc tối ưu cho các phép tính AI, mang lại hiệu năng cao hơn và tiết kiệm năng lượng hơn so với GPU truyền thống.

- Các ông lớn công nghệ như Google, Amazon, Microsoft đều đang phát triển chip AI riêng.

- Nvidia, công ty dẫn đầu thị trường GPU, cũng đã nhận ra xu hướng này và đang đầu tư mạnh vào phát triển chip AI.

- Nvidia đã ra mắt dòng chip Grace dành riêng cho AI, hứa hẹn hiệu năng gấp 10 lần so với GPU.

- Thị trường chip AI dự báo đạt 73,49 tỷ USD vào năm 2025, tăng trưởng kép hàng năm 40,1% giai đoạn 2020-2025.

- Các hãng sản xuất chip truyền thống như Intel, AMD cũng đang đẩy mạnh phát triển chip AI để cạnh tranh.

- Tuy nhiên, Nvidia vẫn đang thống trị thị trường với 80% thị phần GPU trong AI.

- Việc chuyển sang chip AI đòi hỏi các công ty phải thay đổi kiến trúc phần cứng, phần mềm, đào tạo lại nhân sự, đầu tư lớn.

- Dù vậy, chip AI được dự báo sẽ dần thay thế GPU và trở thành chuẩn mực mới cho tính toán AI trong tương lai gần.

📌 Chip AI đang bùng nổ và dần thay thế GPU truyền thống trong huấn luyện AI nhờ hiệu năng vượt trội và tiết kiệm năng lượng. Thị trường chip AI tăng trưởng mạnh 40,1%/năm, dự báo đạt 73,49 tỷ USD năm 2025. Ngay cả Nvidia cũng đang đầu tư mạnh vào chip AI, ra mắt dòng Grace hiệu năng gấp 10 lần GPU, để giữ vững vị thế trong cuộc đua công nghệ này.

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2024-05-31 14:51:13

Các gã khổng lồ công nghệ hợp tác phát triển tiêu chuẩn kết nối mới để đối đầu với Nvidia

- Các công ty công nghệ lớn như Google, Intel, Microsoft, Meta, AMD, Hewlett Packard Enterprise, Cisco và Broadcom đã thành lập nhóm UALink Promoter Group để phát triển tiêu chuẩn kết nối mới cho chip tăng tốc AI trong trung tâm dữ liệu.
- Nhóm UALink nhằm tạo ra một tiêu chuẩn mở thay thế cho công nghệ NVLink độc quyền của Nvidia, giúp kết nối nhiều máy chủ và chip tăng tốc AI trong các ứng dụng AI hiện đại như ChatGPT.
- NVLink của Nvidia hiện đang chiếm ưu thế trong việc kết nối các chip tăng tốc AI, cho phép truyền dữ liệu nhanh hơn và giao tiếp hiệu quả hơn giữa các chip, giúp chúng hoạt động cùng nhau trong các nhiệm vụ phức tạp như huấn luyện mô hình AI lớn.
- Việc kiểm soát tiêu chuẩn kết nối là rất quan trọng vì nó quyết định phần cứng mà các công ty công nghệ sẽ sử dụng. Nhóm UALink muốn thiết lập một tiêu chuẩn mở để nhiều công ty có thể đóng góp và phát triển phần cứng AI, thay vì bị khóa vào hệ sinh thái độc quyền của Nvidia.
- Tiêu chuẩn UALink 1.0 được thiết kế để kết nối lên đến 1.024 GPU trong một "pod" tính toán, bao gồm một hoặc nhiều giá máy chủ, dựa trên các công nghệ như Infinity Architecture của AMD.
- UALink 1.0 dự kiến sẽ cải thiện tốc độ và giảm độ trễ truyền dữ liệu so với các tiêu chuẩn kết nối hiện có.
- Nhóm UALink dự định thành lập UALink Consortium vào cuối năm 2024 để quản lý việc phát triển liên tục của tiêu chuẩn UALink. Các công ty thành viên sẽ có quyền truy cập vào UALink 1.0 khi tham gia, với phiên bản băng thông cao hơn, UALink 1.1, dự kiến ra mắt vào quý 4 năm 2024.
- Các sản phẩm đầu tiên sử dụng UALink dự kiến sẽ có mặt trong vòng hai năm tới, điều này có thể cho Nvidia đủ thời gian để mở rộng sự khóa chặt độc quyền của mình khi thị trường trung tâm dữ liệu AI phát triển.

📌 Các công ty công nghệ lớn đã hợp tác để phát triển tiêu chuẩn kết nối UALink nhằm cạnh tranh với NVLink của Nvidia. Tiêu chuẩn UALink 1.0 sẽ kết nối lên đến 1.024 GPU, cải thiện tốc độ và giảm độ trễ truyền dữ liệu, với các sản phẩm đầu tiên dự kiến ra mắt trong hai năm tới.

https://arstechnica.com/information-technology/2024/05/tech-giants-form-ai-group-to-counter-nvidia-with-new-interconnect-standard/

Không có file đính kèm.

Nguồn tham khảo

AI & công nghệ khác AI chips-hardware-compute 2024-05-31 05:46:28

Infineon đang chế tạo nguồn điện 12 kW cho các trung tâm dữ liệu AI đói năng lượng

- Infineon Technologies công bố thế hệ mới các bộ nguồn máy chủ (PSU), hứa hẹn khả năng cung cấp điện chưa từng có cho các trung tâm dữ liệu tập trung vào máy chủ đám mây và thuật toán AI.

- PSU máy chủ mới của Infineon có thể cung cấp tới 12 kW, tích hợp 3 vật liệu bán dẫn khác nhau vào một module duy nhất gồm silicon (Si), silicon carbide (SiC) và gallium nitride (GaN).

- Các mẫu đầu tiên sẽ có công suất 8 kW, dự kiến ra mắt quý 1/2025. Chưa rõ thời điểm phát hành mẫu 12 kW.

- PSU 12 kW sẽ đạt mức hiệu suất 97.5%, trong khi PSU 8 kW có thể hỗ trợ "giá đỡ AI" với công suất 300 kW trở lên.

- Các trung tâm dữ liệu đang tăng trưởng nhanh nhu cầu năng lượng do sự phổ biến của chatbot và dịch vụ AI.

- PSU mới sẽ giúp giảm tiêu thụ điện nhờ tăng hiệu suất, đồng thời cắt giảm khí thải nhà kính và chi phí vận hành.

- Dự báo đến năm 2030, các trung tâm dữ liệu có thể chiếm 7% tổng mức tiêu thụ điện toàn cầu.

- GPU máy chủ hiện đại yêu cầu tới 1 kW cho mỗi chip và có thể đạt 2 kW "hoặc hơn" vào cuối thập kỷ này.

📌 Infineon đang phát triển PSU 12 kW cho các trung tâm dữ liệu AI, tích hợp Si, SiC và GaN để tăng hiệu suất và độ tin cậy. Mẫu 8 kW dự kiến ra mắt đầu 2025, giúp giảm tiêu thụ điện và chi phí vận hành, trong bối cảnh nhu cầu năng lượng của trung tâm dữ liệu tăng nhanh do AI.

https://www.techspot.com/news/103184-infineon-cooking-up-12-kw-power-supplies-energy.html

Không có file đính kèm.

Nguồn tham khảo

125

AI chips-hardware-compute 2024-05-29 23:23:37

GPU AI Moore Threads MTT S4000 của Trung Quốc dùng để huấn luyện mô hình ngôn ngữ lớn 3 tỷ tham số, cạnh tranh được với Nvidia

- Moore Threads tuyên bố GPU AI S4000 mới nhất của họ nhanh hơn đáng kể so với thế hệ trước.
- Cụm Tính toán Thông minh Kua'e Qianka mới sử dụng GPU S4000 xếp thứ 3 về tốc độ trong bài kiểm tra AI, vượt trội hơn một số cụm GPU AI Nvidia.
- Quá trình huấn luyện mô hình ngôn ngữ lớn MT-infini-3B trên cụm Kua'e Qianka mất 13,2 ngày, chạy hoàn hảo không gián đoạn.
- Tuy nhiên, bảng so sánh thiếu chi tiết, không rõ GPU Nvidia nào được dùng (A100, H100 hay H200) và tác vụ huấn luyện có thể khác nhau.
- Dù vậy, việc huấn luyện LLM trên GPU Moore Threads là bước tiến quan trọng trong lộ trình GPU nội địa của Trung Quốc.
- Hiệu năng thô của S4000 vượt trội hơn nhiều so với GPU AI S3000 và S2000 trước đó của Moore Threads, cũng như vượt qua các bộ tăng tốc AI thế hệ Turing của Nvidia.
- Mặc dù chưa sánh được với GPU AI A100 của Nvidia, nhưng S4000 cho thấy Moore Threads đã có thể xây dựng GPU AI cạnh tranh được với đối thủ phương Tây.
- Đây là thành tựu ấn tượng với một nhà sản xuất GPU mới thành lập chưa đầy 5 năm như Moore Threads.
- Nếu Moore Threads tiếp tục cải thiện hiệu năng qua các thế hệ, họ có thể có bộ tăng tốc GPU AI ngang ngửa với đối thủ phương Tây trong vài năm tới.

📌 GPU AI S4000 mới nhất của Moore Threads cho thấy bước tiến vượt bậc của Trung Quốc trong việc bắt kịp hiệu năng AI của phương Tây. Mặc dù chưa vượt qua được A100 của Nvidia, nhưng khả năng huấn luyện LLM 3 tỷ tham số trong 13,2 ngày của cụm Kua'e Qianka sử dụng S4000 là một cột mốc quan trọng, hứa hẹn Moore Threads sẽ sớm cạnh tranh trực tiếp với các đối thủ như Nvidia, AMD, Intel trong tương lai gần.

https://www.tomshardware.com/pc-components/gpus/china-made-moore-threads-ai-gpus-used-for-three-billion-parameter-llm-training-mtt-s4000-appears-competitive-against-unspecified-nvidia-solutions

Không có file đính kèm.

Nguồn tham khảo

109

AI chips-hardware-compute 2024-05-15 00:04:55

Nvidia ra mắt siêu chip AI Blackwell với giá lên đến 70.000 USD, hệ thống máy chủ có thể lên đến 3 triệu USD

- Nvidia Blackwell GPUs cho ứng dụng AI sẽ đắt hơn so với các bộ xử lý dựa trên Hopper của công ty, theo các nhà phân tích từ HSBC.
- Một siêu chip GB200 (CPU+GPU) có thể có giá lên đến 70.000 USD.
- Nvidia có thể sẽ bán các máy chủ dựa trên GPU Blackwell thay vì bán chip riêng lẻ, với các máy chủ B200 NVL72 dự kiến có giá lên đến 3 triệu USD mỗi chiếc.
- HSBC ước tính giá bán trung bình (ASP) của GPU B100 là từ 30.000 đến 35.000 USD, tương đương với giá của H100.
- Siêu chip GB200, kết hợp một CPU Grace với hai GPU B200, sẽ có giá từ 60.000 đến 70.000 USD.
- Hệ thống máy chủ Nvidia GB200 NVL36 với 36 siêu chip GB200 (18 CPU Grace và 36 GPU B200) có thể được bán với giá trung bình 1,8 triệu USD.
- Hệ thống máy chủ Nvidia GB200 NVL72 với 72 siêu chip GB200 (36 CPU và 72 GPU) có thể có giá khoảng 3 triệu USD.
- CEO Nvidia, Jensen Huang, đã tiết lộ các chip trung tâm dữ liệu Blackwell tại GTC 2024, nhấn mạnh rằng mục tiêu là bán các giá đỡ máy chủ hoàn chỉnh.
- Hệ thống NVL72 tích hợp qua các kết nối băng thông cao để hoạt động như một GPU khổng lồ, cung cấp 13.824 GB VRAM tổng cộng, rất quan trọng trong việc huấn luyện các mô hình ngôn ngữ lớn (LLM).
- Bán các hệ thống hoàn chỉnh thay vì GPU/siêu chip riêng lẻ cho phép Nvidia hấp thụ một phần lợi nhuận từ các nhà tích hợp hệ thống, tăng doanh thu và lợi nhuận.
- Đối thủ của Nvidia như AMD và Intel đang tiến triển chậm với các bộ xử lý AI của họ, cho phép Nvidia bán các bộ xử lý AI của mình với giá cao.
- H200 đã có giá lên đến 40.000 USD cho từng GPU riêng lẻ, trong khi GB200 sẽ tăng gấp bốn lần số lượng GPU, cộng thêm CPU và PCB lớn cho siêu chip.
- Tính toán thô cho một siêu chip GB200 là 5 petaflops FP16 (10 petaflops với sparsity), so với 1/2 petaflops (dense/sparse) trên H200.
- Giá thực tế của phần cứng trung tâm dữ liệu luôn phụ thuộc vào các hợp đồng cá nhân, dựa trên khối lượng phần cứng đặt hàng và các cuộc đàm phán khác.
- Các khách hàng lớn như Amazon và Microsoft có thể nhận được giảm giá lớn, trong khi các khách hàng nhỏ hơn có thể phải trả giá cao hơn so với báo cáo của HSBC.

📌 Nvidia dự kiến sẽ ra mắt siêu chip AI Blackwell với giá lên đến 70.000 USD và hệ thống máy chủ có thể lên đến 3 triệu USD. Các siêu chip này hứa hẹn mang lại doanh thu hàng tỷ USD cho Nvidia, với khả năng tính toán mạnh mẽ và tích hợp cao, đặc biệt quan trọng trong việc huấn luyện các mô hình ngôn ngữ lớn.

https://www.tomshardware.com/pc-components/gpus/nvidias-next-gen-blackwell-ai-gpus-to-cost-up-to-dollar70000-fully-equipped-servers-range-up-to-dollar3000000-report

Không có file đính kèm.

Nguồn tham khảo

136

AI chips-hardware-compute 2024-05-14 03:07:01

Siêu máy tính AI Aurora của Intel phá vỡ rào cản Exascale, đứng thứ 2 sau Frontier

- Aurora, siêu máy tính được tạo ra từ sự hợp tác giữa Intel, HPE và Phòng thí nghiệm Quốc gia Argonne của Bộ Năng lượng Hoa Kỳ, đã phá vỡ rào cản Exascale.
- Nó trở thành cỗ máy thứ hai sau Frontier đạt mốc danh giá này và là siêu máy tính AI nhanh nhất hành tinh.
- Tuy nhiên, Aurora vẫn chưa thể truất ngôi Frontier, siêu máy tính nhanh nhất thế giới do AMD cung cấp.
- Aurora có 21.248 bộ xử lý Intel Xeon CPU Max và 63.744 bộ tăng tốc Intel Data Center GPU Max.
- Trong các bài kiểm tra mới nhất, Aurora đạt hiệu suất 1,012 exaflops chỉ với 9.234 node hoạt động trên tổng số 10.624.
- Trong bài kiểm tra HPL-MxP, Aurora đạt hiệu suất AI 10,6 exaflops chỉ với 89% hệ thống tổng thể hoạt động.
- HPL-MxP sử dụng FP32 và FP16, đại diện tốt hơn cho khả năng AI của máy, trong khi Linpack sử dụng độ chính xác FP64.
- Việc Argonne không thể chạy các bài kiểm tra trên toàn bộ phần cứng Aurora là do nhiều lỗi hệ thống, bao gồm sự cố làm mát, lỗi vận hành và mạng không ổn định.
- Ngay cả khi các kỹ sư khắc phục những vấn đề đó và điều chỉnh hệ thống hoàn hảo, Aurora vẫn khó có thể vượt qua Frontier.
- Hệ thống do AMD cung cấp hiện được đánh giá có hiệu suất 1,206 exaflops, nhanh hơn khoảng 19% so với Aurora.

📌 Mặc dù Aurora đã trở thành siêu máy tính AI nhanh nhất thế giới với hiệu suất 10,6 exaflops trong bài kiểm tra HPL-MxP, nó vẫn đứng thứ hai sau Frontier trong bảng xếp hạng tổng thể. Hệ thống gặp nhiều sự cố và chưa thể chạy các bài kiểm tra trên toàn bộ phần cứng. Ngay cả khi được tối ưu hóa, Aurora vẫn khó có thể vượt qua hiệu suất 1,206 exaflops của Frontier.

https://www.techspot.com/news/102976-intel-powered-aurora-now-fastest-ai-supercomputer-world.html

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute AI PC 2024-05-14 03:00:19

Liên minh MediaTek - Nvidia tham vọng thống lĩnh thị trường PC với chip AI mới

- MediaTek và Nvidia đang hợp tác phát triển một chip AI mới cho thị trường PC, dự kiến hoàn thiện vào cuối năm 2024 và bắt đầu xuất xưởng năm 2025.
- Chip sẽ được sản xuất bởi TSMC trên quy trình N3, giá thành có thể lên tới 300 USD.
- Nvidia có lịch sử lâu dài với kiến trúc Arm, từng phát triển dòng chip Tegra kết hợp lõi Arm Cortex và GPU của Nvidia, được Nintendo sử dụng trên máy chơi game Switch.
- Năm 2024 được dự báo là năm bùng nổ của PC AI với sự tham gia của AMD, Intel, Microsoft. Nvidia muốn giành thị phần đáng kể trong thị trường PC AI mới này.
- Năm 2024 cũng đánh dấu sự hết hạn của thỏa thuận độc quyền giữa Qualcomm và Microsoft về CPU cho PC chạy Windows on Arm, mở đường cho nhiều đối thủ mới gia nhập.
- Qualcomm, đối thủ trực tiếp của MediaTek, cũng đã giới thiệu chip Snapdragon X Elite hỗ trợ AI cho PC.
- Thị trường smartphone đang bão hòa trong khi doanh số PC dự kiến sẽ phục hồi trong 12 tháng tới.
- Chip MediaTek-Nvidia nhiều khả năng sẽ có mức tiêu thụ điện năng thấp dưới 60W, 8-16 lõi CPU Arm và GPU đủ mạnh để chơi game 1080p.

📌 Sự hợp tác giữa MediaTek và Nvidia hứa hẹn sẽ mang lại làn gió mới cho thị trường PC với chip AI mạnh mẽ tích hợp CPU Arm và GPU Nvidia. Dự kiến ra mắt vào năm 2025, chip này sẽ cạnh tranh trực tiếp với các đối thủ như AMD, Intel, Qualcomm trong cuộc đua AI và mang đến cho người dùng nhiều lựa chọn hơn với mức giá hợp lý.

https://www.pcgamer.com/hardware/processors/mediatek-and-nvidia-are-gearing-up-to-tackle-the-ai-pc-market-hand-in-hand-with-an-all-new-chip/

Không có file đính kèm.

Nguồn tham khảo

138

AI chips-hardware-compute 2024-05-14 01:48:43

Siêu máy tính JEDI của châu Âu đứng đầu danh sách Green500 về hiệu quả năng lượng

- JEDI, module tiền thân đầu tiên của siêu máy tính exascale JUPITER thuộc liên doanh EuroHPC, đã đứng đầu danh sách Green500 về các siêu máy tính tiết kiệm năng lượng nhất trên toàn thế giới.
- Các trung tâm dữ liệu tiêu thụ một lượng lớn năng lượng, và nhu cầu tính toán sẽ chỉ tăng lên khi việc đào tạo và chạy AI ngày càng tiêu tốn nhiều tài nguyên quý giá hơn.
- Theo CEO của Arm, Rene Haas, AI có thể chiếm lượng tiêu thụ điện tương đương với Ấn Độ vào năm 2030.
- Vì vậy, điều cấp thiết là tất cả các dự án siêu máy tính được công bố trong vài năm qua phải chịu trách nhiệm về lượng năng lượng chúng cần để vận hành.
- Hầu hết các hệ thống dẫn đầu trên Green500 đều dựa chủ yếu vào GPU của Nvidia.
- JEDI dựa trên Nvidia GH200 Grace Hopper Superchip, kết hợp cả kiến trúc GPU và CPU.
- Nó cũng sử dụng hệ thống làm mát bằng nước nóng trực tiếp, một phần của kiến trúc Eviden BullSequana XH3000, tiêu thụ ít năng lượng hơn đáng kể so với làm mát bằng không khí thông thường.
- Khi hoàn thành, hệ thống JUPITER sẽ có 24.000 chip Nvidia Grace Hopper, 125 giá đỡ BullSequana XH3000 và vượt ngưỡng một exaflop, tương đương với khả năng tính toán một quintillion (số 1 theo sau bởi 18 số 0) phép tính dấu phẩy động mỗi giây.
- Đặc biệt đối với các phép tính 8-bit, phổ biến nhất để đào tạo AI, sức mạnh tính toán sẽ tăng lên đạt hơn 70 exaflops.

📌 Siêu máy tính JEDI của liên doanh EuroHPC đã đứng đầu danh sách Green500 về hiệu quả năng lượng. Khi hoàn thành vào đầu năm 2025, hệ thống JUPITER với 24.000 chip Nvidia Grace Hopper sẽ vượt ngưỡng 1 exaflop và trở thành hệ thống AI mạnh nhất thế giới với sức mạnh tính toán hơn 70 exaflops cho các phép tính 8-bit.

https://thenextweb.com/news/eu-jedi-supercomputer-most-energy-efficient-hpc-system-world

Không có file đính kèm.

Nguồn tham khảo

107

AI chips-hardware-compute 2024-05-14 01:39:31

Nvidia công bố siêu máy tính Grace Hopper mạnh nhất thế giới: 200 exaflops cho AI

- Nvidia công bố 9 siêu máy tính trên toàn cầu sử dụng nền tảng Grace Hopper GH200, bao gồm một CPU Grace 72 nhân và một GPU H100 cho các tác vụ AI và HPC.
- Tổng cộng, các siêu máy tính này đạt hiệu năng tính toán "AI" đáng kinh ngạc là 200 ExaFLOPS, tuy nhiên hiệu năng tính toán FP64 cần thiết cho mô phỏng khoa học thấp hơn đáng kể.
- Các hệ thống mới được triển khai tại nhiều quốc gia như Pháp, Ba Lan, Thụy Sĩ, Đức, Mỹ và Nhật Bản.
- Nổi bật là siêu máy tính EXA1-HE ở Pháp, được phát triển bởi CEA và Eviden, có 477 node tính toán dựa trên bộ xử lý Grace Hopper của Nvidia.
- Một hệ thống quan trọng khác là dự án Isambard-AI tại Đại học Bristol, Anh, được trang bị 168 Nvidia GH200 Superchip ban đầu và dự kiến tăng hiệu năng gấp 32 lần khi bổ sung thêm 5.280 chip vào mùa hè này.
- Khi hoàn thiện, Isambard 3 sẽ có hơn 55.000 nhân hiệu năng cao Arm Neoverse V2, hứa hẹn mang lại hiệu năng FP64 đáng nể.
- Các siêu máy tính đáng chú ý khác bao gồm Helios tại Ba Lan, Alps tại Thụy Sĩ, Jupiter tại Đức, DeltaAI tại Mỹ và Miyabi tại Nhật Bản.
- Điểm then chốt của thông báo là nền tảng Grace Hopper của Nvidia được trang bị CPU và GPU của chính hãng đang ngày càng được ứng dụng rộng rãi trong giới khoa học.

📌 Nvidia đang thâm nhập mạnh mẽ vào lĩnh vực siêu máy tính với nền tảng Grace Hopper GH200, triển khai tại 9 hệ thống đạt tổng cộng 200 ExaFLOPS cho AI trên toàn cầu. Các siêu máy tính như EXA1-HE, Isambard-AI với hơn 55.000 nhân Arm Neoverse V2 hứa hẹn mang lại hiệu năng vượt trội. Bước tiến này cho thấy tầm quan trọng của mảng HPC đối với Nvidia.

Không có file đính kèm.

Nguồn tham khảo

116

AI chips-hardware-compute 2024-05-12 08:11:16

SoftBank đặt cược lớn vào chip AI: Arm sẽ ra mắt sản phẩm đầu tiên vào năm 2025

- Arm, công ty con của SoftBank Group, sẽ thành lập một bộ phận chip AI, với mục tiêu chế tạo nguyên mẫu vào mùa xuân 2025 và sản xuất hàng loạt vào mùa thu cùng năm.
- Arm hiện chiếm hơn 90% thị phần kiến trúc cho bộ xử lý dùng trong điện thoại thông minh.
- Chi phí phát triển ban đầu, ước tính hàng trăm tỷ yên, sẽ do Arm và SoftBank gánh vác. Khi hệ thống sản xuất hàng loạt được thiết lập, mảng kinh doanh chip AI có thể được tách ra và đặt dưới SoftBank.
- SoftBank đang đàm phán với TSMC và các đối tác khác về sản xuất, tìm cách đảm bảo năng lực sản xuất.
- CEO Masayoshi Son kỳ vọng mang đến sự đổi mới trong nhiều ngành công nghiệp bằng cách kết hợp công nghệ AI, bán dẫn và robot mới nhất.
- Thị trường chip AI dự kiến sẽ vượt 100 tỷ USD vào năm 2029 và trên 200 tỷ USD vào năm 2032.
- SoftBank dự kiến xây dựng các trung tâm dữ liệu được trang bị chip nội bộ tại Mỹ, châu Âu, châu Á và Trung Đông sớm nhất là vào năm 2026, đồng thời mở rộng sang lĩnh vực sản xuất điện.
- Tập đoàn cũng tìm kiếm các thương vụ mua bán và sáp nhập, với tổng đầu tư dự kiến lên tới 10 nghìn tỷ yên.

📌 SoftBank đang đặt cược lớn vào chip AI với khoản đầu tư 10 nghìn tỷ yên, nhằm biến mình thành một tập đoàn AI khổng lồ. Arm sẽ phát triển chip AI, dự kiến ra mắt sản phẩm đầu tiên vào năm 2025, trong khi SoftBank mở rộng sang các lĩnh vực trung tâm dữ liệu, robot và sản xuất điện. Thị trường chip AI được dự báo vượt 200 tỷ USD vào năm 2032.

https://asia.nikkei.com/Business/Technology/SoftBank-s-Arm-plans-to-launch-AI-chips-in-2025

Không có file đính kèm.

Nguồn tham khảo

104

AI chips-hardware-compute 2024-05-11 09:20:38

Apple gia nhập cuộc chiến chip AI, đẩy cuộc đua lên tầm cao mới

- Apple đã chính thức gia nhập cuộc chiến chip AI với việc ra mắt chip M2 Ultra, được tích hợp trong máy Mac Studio mới.
- Chip M2 Ultra của Apple sử dụng kiến trúc "chiplet", cho phép kết nối nhiều chip nhỏ hơn để tạo thành một chip lớn hơn, mạnh mẽ hơn.
- Các đối thủ của Apple trong cuộc đua chip AI bao gồm Nvidia, Google, Microsoft và Amazon, với Nvidia hiện đang dẫn đầu thị trường.
- Nvidia đang phát triển siêu máy tính AI mạnh nhất thế giới, DGX GH200, sử dụng chip Grace Hopper "superchip".
- Google cũng đang phát triển chip AI riêng, trong khi Microsoft hợp tác với OpenAI và sử dụng chip Nvidia để cung cấp năng lực AI.
- Amazon cũng đang phát triển chip Inferentia riêng để cạnh tranh trong lĩnh vực điện toán đám mây AI.
- Cuộc đua phát triển chip AI đang diễn ra vô cùng khốc liệt, với các ông lớn công nghệ đầu tư hàng tỷ USD để giành lợi thế.
- Thị trường chip AI được dự báo sẽ đạt 194 tỷ USD vào năm 2030, tăng mạnh từ mức 21 tỷ USD năm 2022.
- Sự bùng nổ của AI đòi hỏi những chip mạnh mẽ hơn để xử lý khối lượng dữ liệu và tính toán khổng lồ.
- Cuộc chiến chip AI không chỉ là cuộc đua công nghệ mà còn là cuộc chiến giành ưu thế trên thị trường công nghệ toàn cầu.

📌 Apple đã chính thức gia nhập cuộc chiến chip AI với chip M2 Ultra, đẩy cuộc đua công nghệ giữa các ông lớn như Nvidia, Google, Microsoft và Amazon lên một tầm cao mới. Thị trường chip AI dự kiến đạt 194 tỷ USD vào năm 2030, cho thấy tầm quan trọng của cuộc đua không chỉ về mặt công nghệ mà còn cả trong việc giành ưu thế trên thị trường toàn cầu.

Citations:
[1] https://finance.yahoo.com/news/with-apple-entering-the-fight-the-ai-chip-wars-have-gone-nuclear-150546931.html

Không có file đính kèm.

Nguồn tham khảo

133

AI chips-hardware-compute 2024-05-10 07:48:26

Apple chuẩn bị trung tâm dữ liệu tập trung AI với máy chủ chạy chip nội bộ

- Apple sẽ cung cấp một số tính năng trí tuệ nhân tạo sắp tới thông qua các trung tâm dữ liệu được trang bị bộ xử lý nội bộ của riêng họ.
- Các tính năng AI đơn giản hơn sẽ được xử lý trực tiếp trên iPhone, iPad và Mac.
- Apple sẽ không phụ thuộc vào các bộ xử lý tập trung vào AI từ Nvidia hay các nhà sản xuất chip khác. Thay vào đó, họ sẽ bắt đầu với M2 Ultra, bộ xử lý Mac cao cấp hiện tại của mình.
- Chip Nvidia "Blackwell" B200 mới tập trung vào AI có giá từ 30.000 đến 40.000 USD mỗi chip.
- Apple muốn giữ chức năng AI cục bộ càng nhiều càng tốt vì nó riêng tư hơn và thường nhanh hơn. Nhưng khi một tác vụ vượt quá khả năng của điện thoại hoặc máy tính để bàn, nó có thể chuyển sang máy chủ từ xa.
- Bộ xử lý Apple M4 mới sẽ ra mắt trên iPad Pro 2024, nhưng dự kiến sẽ có trên Mac vào cuối năm nay. M4 có Neural Engine nhanh nhất từ trước đến nay của Apple, có khả năng xử lý tới 38 nghìn tỷ phép tính mỗi giây, nhanh hơn bộ xử lý neural của bất kỳ PC AI nào.

📌 Apple đang chuẩn bị mạnh mẽ cho AI với trung tâm dữ liệu chạy chip nội bộ M2 Ultra, trong khi các tính năng đơn giản hơn sẽ xử lý trên thiết bị. Chip M4 mới với Neural Engine mạnh nhất từ trước đến nay sẽ giúp đưa AI lên iPhone, iPad, Mac trong năm nay.

Citations:
[1] https://www.cultofmac.com/856004/apple-ai-data-centers-servers-in-house-chips/

Không có file đính kèm.

Nguồn tham khảo

101

AI chips-hardware-compute 2024-05-10 00:44:01

Nvidia sẽ ra mắt GPU AI R100 vào cuối năm 2025 với kiến trúc đa chip Vera Rubin

- Nvidia dự kiến ra mắt dòng GPU AI thế hệ tiếp theo mang tên R100 vào cuối năm 2025.
- R100 sẽ sử dụng kiến trúc đa chip mới có tên Vera Rubin, được sản xuất trên tiến trình 3nm của TSMC.
- Vera Rubin sẽ tận dụng công nghệ đóng gói chip tiên tiến CoWoS-L (Chip-on-Wafer-on-Substrate with Liner) của TSMC.
- Kiến trúc đa chip cho phép tích hợp nhiều GPU die trên cùng một package, giúp tăng hiệu suất và khả năng mở rộng.
- R100 sẽ kế thừa kiến trúc Hopper (GH100) hiện tại của Nvidia, nhưng với nhiều cải tiến về hiệu suất và tính năng.
- Nvidia đang hợp tác chặt chẽ với TSMC để phát triển và sản xuất chip R100 trên quy trình 3nm tiên tiến.
- Việc sử dụng tiến trình 3nm sẽ giúp tăng mật độ transistor, cải thiện hiệu suất và tiết kiệm năng lượng cho R100.
- Công nghệ CoWoS-L cho phép đóng gói nhiều chip trên cùng một tấm nền (substrate), giúp tăng băng thông và giảm độ trễ giữa các chip.
- R100 dự kiến sẽ mang lại hiệu suất vượt trội so với thế hệ GPU AI hiện tại của Nvidia, đáp ứng nhu cầu ngày càng tăng trong lĩnh vực AI và học sâu.
- Nvidia đang đầu tư mạnh mẽ vào nghiên cứu và phát triển các giải pháp GPU AI tiên tiến để duy trì vị thế dẫn đầu trong ngành công nghiệp.

📌 Nvidia đang chuẩn bị ra mắt GPU AI thế hệ tiếp theo R100 vào cuối năm 2025, sử dụng kiến trúc đa chip Vera Rubin trên tiến trình 3nm và công nghệ đóng gói CoWoS-L của TSMC, hứa hẹn mang lại hiệu suất vượt trội và khả năng mở rộng đáng kể cho các ứng dụng AI và học sâu.

Citations:
[1] https://www.tomshardware.com/pc-components/gpus/nvidias-unannounced-r100-ai-gpus-reportedly-coming-in-late-2025-vera-rubin-multi-chip-designs-using-3nm-and-cowos-l

Không có file đính kèm.

Nguồn tham khảo

181

AI chips-hardware-compute 2024-05-08 17:30:22

TSMC dự báo AI sẽ chiếm hơn 20% doanh thu vào năm 2028

- Vào đầu năm 2023, ChatGPT đã khởi đầu một làn sóng toàn cầu về AI tạo sinh, làm tăng nhu cầu đối với phần mềm và phần cứng liên quan.
- Nvidia, một trong những công ty đi đầu trong lĩnh vực này, đã chứng kiến giá trị thị trường của mình tăng vọt.
- Chuỗi cung ứng, bao gồm cả các nhà cung cấp phía trên và phía dưới, đã thể hiện sự kiên cường tương đối trước những thách thức của ngành.
- TSMC, nhà sản xuất chip hàng đầu thế giới, dự báo rằng AI sẽ đóng góp hơn 20% vào doanh thu của họ vào năm 2028.
- Sự bùng nổ của AI tạo sinh không chỉ thúc đẩy nhu cầu về phần cứng mà còn cả phần mềm, mở rộng cơ hội cho các công ty công nghệ và sản xuất.
- TSMC đã đầu tư mạnh mẽ vào việc phát triển và sản xuất các mạch tích hợp (IC) chuyên biệt cho AI, nhằm đáp ứng nhu cầu ngày càng tăng.
- Các nhà phân tích dự báo rằng sự tăng trưởng này sẽ tiếp tục mạnh mẽ trong những năm tới, với AI ngày càng trở thành một phần không thể thiếu trong nhiều lĩnh vực công nghệ.

📌 TSMC dự báo AI sẽ chiếm hơn 20% doanh thu vào năm 2028, nhờ vào sự bùng nổ của AI tạo sinh kể từ đầu năm 2023. Nvidia và chuỗi cung ứng toàn cầu cũng ghi nhận sự tăng trưởng đáng kể, phản ánh nhu cầu mạnh mẽ cho phần mềm và phần cứng liên quan đến AI.

Citations:
[1] https://www.digitimes.com/news/a20240506PD208/tsmc-ai-ic-manufacturing-revenue-2028.html

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute AI smartphone 2024-05-08 07:40:37

Apple "chơi lớn" với chip M4: Khai phá sức mạnh AI trên iPad và MacBook

- Apple giới thiệu chip M4 thế hệ mới, tập trung vào cải thiện hiệu suất cho các tác vụ liên quan đến AI.
- Chip M4 sẽ xuất hiện trên các mẫu iPad Pro OLED mới và MacBook trong năm nay.
- Tại sự kiện ra mắt, Apple nhấn mạnh mạnh vào khả năng AI của chip M4.
- Neural engine mới giúp tăng tốc độ xử lý cho các tác vụ học máy lên đến 40%.
- Chip M4 được sản xuất trên quy trình 3nm tiên tiến, mang lại hiệu suất cao và tiết kiệm năng lượng.
- iPad Pro mới sẽ tận dụng sức mạnh AI của M4 để cải thiện trải nghiệm người dùng trên iPadOS.
- Các tính năng như nhận dạng chữ viết tay, xử lý ngôn ngữ tự nhiên, và tăng cường thực tế ảo sẽ được hưởng lợi từ chip M4.
- Trên MacBook, chip M4 giúp tăng tốc độ xử lý cho các ứng dụng đòi hỏi AI như chỉnh sửa video và hình ảnh.
- Apple kỳ vọng chip M4 sẽ thúc đẩy sự phát triển của các ứng dụng và trò chơi dựa trên AI trên nền tảng của họ.
- Việc ra mắt chip M4 cho thấy tham vọng của Apple trong việc dẫn đầu cuộc đua phát triển AI trên thiết bị di động và máy tính.

📌 Apple ra mắt chip M4 với khả năng AI vượt trội, xuất hiện trên iPad Pro OLED và MacBook mới. Neural engine cải tiến tăng tốc độ xử lý học máy lên 40%, thúc đẩy trải nghiệm người dùng và ứng dụng AI trên iPadOS và macOS. Bước tiến này thể hiện tham vọng dẫn đầu của Apple trong cuộc đua phát triển AI.

Citations:
[1] https://www.theverge.com/2024/5/7/24148451/apple-m4-chip-ai-ipad-macbook

Không có file đính kèm.

Nguồn tham khảo

146

AI chips-hardware-compute 2024-05-08 05:47:34

GPU Trung Quốc Lingjiu GP201 vượt mặt đồ họa tích hợp AMD 10 năm tuổi, sẵn sàng sản xuất hàng loạt

- Lingjiu GP201, GPU đầu tiên của Trung Quốc, đã đạt hiệu năng vượt trội hơn 30% so với đồ họa tích hợp AMD Radeon HD 8400 ra mắt cách đây 10 năm.
- GPU này sử dụng kiến trúc đồ họa tùy chỉnh với 256 lõi CUDA, xung nhịp 1.5 GHz, băng thông bộ nhớ 128 GB/s và hiệu suất 768 GFLOPS.
- Lingjiu GP201 đã sẵn sàng cho sản xuất hàng loạt và sẽ được tích hợp vào các sản phẩm máy tính để bàn và laptop trong nước.
- Thành công này đánh dấu bước tiến quan trọng của Trung Quốc trong nỗ lực giảm sự phụ thuộc vào công nghệ bán dẫn nước ngoài và thúc đẩy ngành công nghiệp chip nội địa.
- Mặc dù hiệu năng của Lingjiu GP201 vẫn còn khoảng cách đáng kể so với các GPU hiện đại của Nvidia và AMD, nhưng nó cho thấy tiềm năng của Trung Quốc trong việc phát triển công nghệ GPU độc lập.
- Các chuyên gia dự đoán rằng trong 5-10 năm tới, Trung Quốc có thể sản xuất GPU có hiệu năng tương đương với các sản phẩm tầm trung của Nvidia và AMD.
- Sự ra đời của Lingjiu GP201 sẽ tạo áp lực cạnh tranh lên thị trường GPU toàn cầu và có thể buộc các nhà sản xuất lớn phải điều chỉnh chiến lược kinh doanh của họ.

📌 Lingjiu GP201, GPU nội địa đầu tiên của Trung Quốc, đã vượt qua hiệu năng của đồ họa tích hợp AMD 10 năm tuổi và sẵn sàng cho sản xuất hàng loạt. Thành công này đánh dấu bước tiến quan trọng của Trung Quốc trong việc phát triển ngành công nghiệp bán dẫn độc lập, tạo áp lực cạnh tranh mới trên thị trường GPU toàn cầu.

Citations:
[1] https://www.tomshardware.com/pc-components/gpus/chinese-made-gpu-beats-performance-of-10-year-old-integrated-amd-graphics-lingjiu-gp201-hits-mass-production

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2024-05-06 23:22:46

tại sao GPU của NVIDIA vẫn chưa có mặt tại thị trường Ấn Độ và dự kiến sẽ có sau cuộc bầu cử

- NVIDIA dự kiến sẽ nhập khẩu GPU vào thị trường Ấn Độ sau cuộc bầu cử Lok Sabha.
- Yotta, một công ty AI của Ấn Độ, đã nhận được lô hàng đầu tiên gồm 4.000 GPU từ ASUS, nhưng không có sự hiện diện của NVIDIA.
- Yotta sử dụng máy chủ ESC N8-E11 của ASUS với 8 GPU NVIDIA HGX H100 để nâng cấp nền tảng Shakti Cloud, hỗ trợ phát triển và triển khai mô hình AI.
- Yotta dự định tăng số lượng GPU lên 32.768 đơn vị vào cuối năm 2025 và đã thông báo kế hoạch nhập khẩu 24.000 GPU trong đó có NVIDIA H100s và L40S.
- Yotta là đối tác Elite trong Mạng lưới Đối tác NVIDIA và được ưu tiên cao trong việc phân bổ GPU.
- Sunil Gupta của Yotta cho biết công ty có thể xây dựng đồng thời 5 mô hình GPT-4 với cơ sở hạ tầng hiện có.
- Yotta cũng là Đối tác Đám mây duy nhất của Mạng lưới Đối tác NVIDIA tại Ấn Độ và sẽ nhận GPU Blackwell mới nhất vào tháng 10.
- Các công ty khác tại Ấn Độ như Sarvam AI và SML gặp khó khăn trong việc tiếp cận GPU NVIDIA cao cấp như H100.
- Ola Krutrim, một unicorn AI của Ấn Độ, đang sử dụng cụm Intel Gaudi 2 để đào tạo mô hình cơ sở.
- Zoho đang tìm kiếm các lựa chọn thay thế cho NVIDIA và đã đầu tư gần 10 triệu USD để mua GPU từ ba nhà cung cấp chính là Intel, AMD và NVIDIA.
- Chính phủ Ấn Độ đã phê duyệt chương trình AI trị giá 10.371.92 tỷ INR (126,5 triệu USD), bao gồm triển khai 10.000 GPU thông qua các quan hệ đối tác công-tư.
- NVIDIA đã hứa hẹn sẽ cung cấp hàng chục nghìn GPU cho Ấn Độ và đã hợp tác với Reliance, Tata và chính phủ để thiết lập một cụm 25.000 GPU dành cho các startup.

📌 NVIDIA dự kiến sẽ đưa GPU vào thị trường Ấn Độ sau cuộc bầu cử Lok Sabha, với Yotta là đối tác Elite và dự kiến tăng quy mô lên 32.768 GPU vào cuối năm 2025. Các công ty khác như Sarvam AI và SML gặp khó khăn trong việc tiếp cận GPU NVIDIA, trong khi Ola Krutrim và Zoho đang tìm kiếm các lựa chọn thay thế. Chính phủ Ấn Độ đã phê duyệt chương trình AI trị giá khoảng 126,5 triệu USD, bao gồm triển khai 10.000 GPU thông qua các quan hệ đối tác công-tư.

https://analyticsindiamag.com/why-nvidia-gpus-are-still-not-available-in-india

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2024-05-06 11:53:52

Yotta Data Services của Ấn Độ có thể xây dựng đồng thời 5 mô hình GPT-4 với cơ sở hạ tầng hiện có, sử dụng 16.000 GPU đã đặt hàng từ NVIDIA

- Sunil Gupta, giám đốc công ty trung tâm dữ liệu Yotta Data Services của tập đoàn Hiranandani, cho biết Ấn Độ có thể xây dựng đồng thời 5 mô hình GPT-4 với cơ sở hạ tầng hiện có của họ.
- Yotta Data Services đã đặt hàng 16.000 GPU từ NVIDIA, cho phép xử lý tải của 5 khách hàng cùng lúc, mỗi khách hàng muốn tạo ra một GPT-4.
- Công ty đã nhận được 4.000 GPU đầu tiên, với kế hoạch mở rộng lên 32.768 đơn vị vào cuối năm 2025, trong khuôn khổ hợp tác trị giá gần 1 tỷ USD với NVIDIA.
- Các chip tiên tiến từ NVIDIA sẽ cung cấp sức mạnh cho nền tảng đám mây Shakti sắp tới của Yotta, đưa nó trở thành siêu máy tính nhanh thứ 10 trên toàn cầu.
- Yotta Data Services cũng hợp tác với Deloitte India để cung cấp cho khách hàng quyền truy cập vào cơ sở hạ tầng GPU của NVIDIA nhằm phát triển các ứng dụng AI tạo sinh một cách hiệu quả.
- Gần đây, Yotta Data Services đã hợp tác với BLC Holdings của Nepal để xây dựng trung tâm dữ liệu siêu đám mây đầu tiên của Nepal, có tên "K1", tại Ramkot gần Kathmandu.
- Cơ sở K1 trị giá hàng triệu USD sẽ cung cấp công suất tải CNTT tới 4MW, trải rộng trên 3 mẫu Anh và diện tích 60.000 feet vuông, cung cấp các dịch vụ đám mây, CNTT và an ninh mạng.

📌 Yotta Data Services của Ấn Độ đang đầu tư mạnh vào cơ sở hạ tầng GPU tiên tiến, với 16.000 GPU đã đặt hàng từ NVIDIA, cho phép xây dựng đồng thời 5 mô hình GPT-4. Hợp tác với NVIDIA và Deloitte India giúp Yotta cung cấp nền tảng đám mây Shakti mạnh mẽ, hỗ trợ phát triển ứng dụng AI. Dự án trung tâm dữ liệu siêu đám mây K1 tại Nepal là một bước tiến quan trọng khác của công ty.

Citations:
[1] https://analyticsindiamag.com/india-can-build-five-gpt-4-models-simultaneously-on-yotta-infrastructure/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute Semi-Cloud-DC-Green 2024-05-06 05:41:12

CoreWeave huy động 1.1 tỷ USD, cho thấy thị trường đám mây thay thế đang bùng nổ

- CoreWeave, nhà cung cấp hạ tầng GPU khởi đầu như một hoạt động khai thác tiền điện tử, vừa huy động được 1.1 tỷ USD từ các nhà đầu tư như Coatue, Fidelity và Altimeter Capital.
- Vòng gọi vốn này đưa định giá của CoreWeave lên 19 tỷ USD, tổng số tiền huy động được là 5 tỷ USD chỉ trong chưa đầy 10 năm hoạt động.
- Không chỉ CoreWeave, Lambda Labs cũng huy động được 500 triệu USD, Voltage Park đầu tư 500 triệu USD vào các trung tâm dữ liệu dựa trên GPU, Together AI nhận được 106 triệu USD do Salesforce dẫn đầu.
- Theo Gartner, các công ty như CoreWeave tham gia vào thị trường "GPU như một dịch vụ" chuyên biệt, cung cấp một lựa chọn thay thế cho các nhà cung cấp siêu lớn trong bối cảnh nhu cầu GPU cao.
- Forrester cho rằng các nhà cung cấp đám mây thay thế như CoreWeave thành công một phần vì họ không phải đối mặt với "gánh nặng" cơ sở hạ tầng như các nhà cung cấp lâu đời.
- Tuy nhiên, Forrester cũng nghi ngờ về tính bền vững của sự tăng trưởng này.

📌 CoreWeave huy động được 1.1 tỷ USD, nâng tổng vốn lên 5 tỷ USD và định giá lên 19 tỷ USD, cho thấy sự bùng nổ của thị trường đám mây thay thế hay "GPU như một dịch vụ" chuyên biệt, cung cấp một lựa chọn thay thế cho các nhà cung cấp siêu lớn trong bối cảnh nhu cầu GPU cao. Các công ty như Lambda Labs, Voltage Park, Together AI cũng ghi nhận các khoản đầu tư lớn. Tuy nhiên, tính bền vững của xu hướng này vẫn còn nhiều nghi vấn.

Citations:
[1] https://techcrunch.com/2024/05/05/coreweaves-1-1b-raise-shows-the-market-for-alternative-clouds-is-booming/

Không có file đính kèm.

Nguồn tham khảo

121

AI kiến thức-khóa học AI chips-hardware-compute 2024-05-05 01:30:06

Cách xây dựng máy chủ AI hiệu suất cao, giá rẻ, bảo mật dữ liệu

- Trong thời đại số ngày nay, quyền riêng tư dữ liệu là mối quan tâm hàng đầu. Xây dựng máy chủ AI cục bộ hiệu suất cao là giải pháp tuyệt vời, cho phép tùy chỉnh theo ngân sách và giữ an toàn, bảo mật dữ liệu, phản hồi, mô hình AI bằng phần mềm nguồn mở.

- NetworkChuck, kỹ sư mạng và người đam mê công nghệ, đã hướng dẫn chi tiết cách anh ấy xây dựng máy chủ AI chạy cục bộ, xử lý mô hình ngôn ngữ lớn cho các dự án AI giá rẻ, riêng tư và an toàn, không cần trả phí hàng tháng cho các nhà cung cấp AI đám mây như ChatGPT của OpenAI, Claude 3 của Anthropic...

- Cấu hình phần cứng mạnh mẽ bao gồm: CPU AMD Ryzen 9 7950X xử lý vượt trội các mô hình AI phức tạp và bộ dữ liệu lớn; 128GB RAM DDR5 cho tốc độ xử lý nhanh, đa nhiệm mượt mà; 2 GPU NVIDIA RTX 4090 tăng tốc các tác vụ AI.

- Máy chủ AI cục bộ còn là công cụ giáo dục giá trị, cung cấp nền tảng khám phá, hiểu các khái niệm AI phức tạp, cho phép sinh viên, nhà nghiên cứu tương tác thực tế với công nghệ tiên tiến. Khả năng tùy chỉnh tài nguyên AI theo mục tiêu học tập và tiêu chuẩn đạo đức cụ thể khiến nó trở thành giải pháp lý tưởng cho các cơ sở giáo dục.

📌 Xây dựng máy chủ AI cục bộ hiệu suất cao là cách tuyệt vời để tận dụng sức mạnh của trí tuệ nhân tạo, đồng thời duy trì quyền riêng tư dữ liệu. Với phần cứng mạnh mẽ như CPU AMD Ryzen 9 7950X, 128GB RAM DDR5, 2 GPU NVIDIA RTX 4090 và phần mềm nguồn mở, bạn có thể xây dựng hệ thống AI tùy chỉnh, an toàn với chi phí hợp lý, phục vụ cho nghiên cứu, học tập về AI tiên tiến.

Citations:
[1] https://www.geeky-gadgets.com/building-an-ai-server/

Không có file đính kèm.

Nguồn tham khảo

142

AI chips-hardware-compute 2024-05-04 05:21:30

làm thế nào để kiếm tiền tỷ từ việc cho thuê GPU, không phải bán chúng

- Các công ty lớn như Microsoft Azure, Meta Platforms, Amazon Web Services, và Google Cloud đã nhận được số lượng lớn GPU H100 từ Nvidia, với mục đích cho thuê chúng để đào tạo mô hình AI.
- CoreWeave và Lambda, hai công ty nhỏ hơn, đang thu hút sự chú ý vì họ đã nhận được đầu tư mạo hiểm lớn và đang chuẩn bị cho các đợt IPO sắp tới.
- Nvidia đánh giá cao khả năng thu nhập từ việc cho thuê GPU, với dự đoán thu nhập cho thuê lên đến 2,5 tỷ USD trong vòng bốn năm, dựa trên giá 4 USD mỗi giờ GPU.
- CoreWeave đã nhận được tổng cộng 4,46 tỷ USD từ các vòng tài chính và cho vay, và dự kiến thu nhập 15,68 tỷ USD từ việc cho thuê GPU trong bốn năm.
- Lambda, mặc dù nhỏ hơn, cũng đã thu hút được tổng cộng 932,2 triệu USD từ các nguồn tài trợ và đang mở rộng hoạt động kinh doanh GPU cloud của mình.
- Cả hai công ty đều cung cấp GPU với chi phí thấp hơn so với các đám mây lớn như AWS, nhưng điều này có thể không bền vững nếu nhu cầu về GPU giảm xuống.
- Việc cho thuê GPU được đánh giá là có lợi nhuận cao hơn so với việc bán chúng, đặc biệt khi nhu cầu về tài nguyên tính toán cho AI và mô hình ngôn ngữ lớn ngày càng tăng.

📌 CoreWeave và Lambda đang tận dụng cơ hội từ thị trường cho thuê GPU, với dự đoán thu nhập lên đến 15,68 tỷ USD và 932,2 triệu USD từ các nguồn tài trợ. Nvidia cũng nhận thấy tiềm năng lớn từ việc cho thuê GPU, với ước tính thu nhập 2,5 tỷ USD trong bốn năm. Các công ty này đều hướng đến việc cung cấp tài nguyên tính toán cho AI với chi phí thấp hơn so với các nhà cung cấp lớn.

Citations:
[1] https://www.nextplatform.com/2024/05/02/how-to-make-more-money-renting-a-gpu-than-nvidia-makes-selling-it/

Không có file đính kèm.

Nguồn tham khảo

127

AI tools AI chips-hardware-compute 2024-05-04 04:58:21

Confluent tung giải pháp plug-and-play đẩy nhanh AI streaming thời gian thực

- Confluent hiện cung cấp khả năng suy luận mô hình AI cho một số khách hàng xây dựng ứng dụng AI thời gian thực với Flink. Công ty có kế hoạch mở rộng quyền truy cập và ra mắt thêm các tính năng để việc chạy ứng dụng AI với dữ liệu streaming trở nên dễ dàng, rẻ và nhanh hơn.

- Confluent giới thiệu Freight Clusters, một loại cụm serverless mới cho khách hàng, tận dụng sao chép rẻ hơn nhưng chậm hơn trên các trung tâm dữ liệu, giúp giảm tới 90% chi phí.

- Tại sự kiện Kafka Summit ở Bengaluru, Ấn Độ, hơn 30% người tham dự đến từ khu vực này. Jay Kreps, CEO và đồng sáng lập Confluent, chia sẻ tầm nhìn về việc tạo ra các sản phẩm dữ liệu phổ quát hỗ trợ cả mặt vận hành và phân tích của dữ liệu.

- Confluent giới thiệu khả năng suy luận mô hình AI trong giải pháp cloud-native cho Apache Flink, đơn giản hóa các ứng dụng AI và machine learning thời gian thực. Trước đây, các nhóm sử dụng Flink phải viết mã và dùng nhiều công cụ để kết nối mô hình và pipeline xử lý dữ liệu.

- Hiện tại, Confluent cung cấp quyền truy cập suy luận mô hình AI cho một số khách hàng xây dựng ứng dụng AI thời gian thực với Flink. Công ty dự kiến mở rộng quyền truy cập và ra mắt thêm tính năng để đơn giản hóa quá trình này.

📌 Confluent ra mắt giải pháp plug-and-play cho AI streaming thời gian thực, giúp triển khai ứng dụng AI dễ dàng và rẻ hơn tới 90% với dữ liệu streaming. Công ty cũng giới thiệu Freight Clusters serverless và tầm nhìn về sản phẩm dữ liệu phổ quát tại Kafka Summit thu hút đông đảo người tham dự.

Citations:
[1] https://venturebeat.com/data-infrastructure/confluent-launches-plug-and-play-offering-to-accelerate-realtime-streaming-ai/

Không có file đính kèm.

Nguồn tham khảo

152

AI chips-hardware-compute 2024-05-04 04:23:17

Groq với kiến trúc LPU cách mạng hóa việc tăng tốc AI và giảm thiểu độ trễ

- Groq phát triển kiến trúc LPU (Logic Processing Unit), một bộ tăng tốc đại số tuyến tính đa năng, rất phù hợp cho các ứng dụng AI/ML.

- Mục tiêu của Groq là tạo ra tương tác giữa AI và con người ở mức độ trễ thấp. Thời gian phản hồi nhanh là yếu tố then chốt để giữ sự tương tác của con người.

- Kiến trúc LPU của Groq theo mô hình pipeline, khác biệt hoàn toàn so với kiến trúc hub-and-spoke của CPU/GPU truyền thống. Điều này giúp giảm thiểu độ trễ, tăng hiệu năng trên mỗi đơn vị chi phí và công suất.

- Groq Cloud cung cấp quyền truy cập vào các mô hình AI mã nguồn mở được triển khai trên phần cứng của Groq thông qua API, tương tự như OpenAI hay Anthropic.

- Kiến trúc của Groq tiêu thụ ít nhất 10 lần ít năng lượng hơn so với GPU, do tránh được việc truy xuất dữ liệu liên tục từ bộ nhớ bên ngoài.

- Groq không lo ngại về việc NVIDIA công bố nền tảng Blackwell mới. Họ tin rằng kiến trúc mới của mình sẽ vượt trội hơn nhiều so với GPU truyền thống trong tương lai.

- Groq tập trung phát triển trình biên dịch tối ưu cho phần cứng của mình, giúp đơn giản hóa việc lập trình và tận dụng tối đa hiệu năng phần cứng.

📌 Groq đang dẫn đầu cuộc cách mạng về kiến trúc xử lý cho AI với LPU theo mô hình pipeline. Kiến trúc này hứa hẹn mang lại hiệu năng cao hơn ít nhất 10 lần, độ trễ thấp hơn và tiêu thụ ít năng lượng hơn đáng kể so với GPU truyền thống. Groq không lo ngại về việc NVIDIA công bố nền tảng Blackwell mới. Họ tin rằng kiến trúc mới của mình sẽ vượt trội hơn nhiều so với GPU truyền thống trong tương lai.

Citations:
[1] https://www.forbes.com/video/53852912-e4a4-462d-8a3c-b60427d49b82/how-groq-is-building-a-faster-ai-interface/

Không có file đính kèm.

Nguồn tham khảo

124

AI chips-hardware-compute 2024-05-03 01:03:15

Nvidia cho rằng GPU của họ tốt hơn NPU cho AI trên thiết bị

- Nvidia cho rằng GPU rời của họ tốt hơn NPU cho các ứng dụng AI tạo sinh cục bộ, có thể xem NPU từ các công ty khác là mối đe dọa.
- Kể từ khi ra mắt CPU Meteor Lake vào cuối năm ngoái, Intel đã cố gắng đẩy mạnh laptop tích hợp NPU như một lớp "PC AI" mới để thực hiện các hoạt động AI tạo sinh mà không cần dựa vào các trung tâm dữ liệu đám mây khổng lồ.
- Microsoft và Qualcomm dự định đưa nhiều PC AI hơn ra thị trường vào cuối năm nay, và Apple dự kiến sẽ tham gia vào năm 2024 với các bộ xử lý M4 và A18 bionic sắp tới.
- Microsoft đang cố gắng quảng bá các dịch vụ của mình như một yêu cầu thiết yếu cho tất cả PC AI, bao gồm trợ lý ảo Copilot và phím Copilot mới.
- Nvidia cho rằng card đồ họa RTX của họ, đã có mặt trên thị trường từ năm 2018, phù hợp hơn nhiều cho các tác vụ AI, ngụ ý rằng NPU là không cần thiết và hàng triệu "PC AI" đã được lưu hành.
- Nvidia tuyên bố GPU RTX có thể đạt 100-1.300 TOPS, vượt xa yêu cầu 40 TOPS của Microsoft cho PC AI thế hệ tiếp theo.
- Nvidia cho rằng chip như card đồ họa RTX 30 và 40 hiện tại là công cụ tuyệt vời cho sáng tạo nội dung, năng suất, chatbot và các ứng dụng khác liên quan đến nhiều mô hình ngôn ngữ lớn.
- Nvidia đã ra mắt bản cập nhật lớn cho ChatRTX, chatbot này hoạt động cục bộ trên bất kỳ PC nào được trang bị GPU RTX 30 hoặc 40 và tối thiểu 8 GB VRAM, có khả năng trả lời các truy vấn bằng nhiều ngôn ngữ bằng cách quét qua tài liệu hoặc danh sách phát YouTube do người dùng cung cấp.

📌 Nvidia khẳng định GPU RTX của họ vượt trội hơn NPU cho AI trên thiết bị, có thể đạt 100-1.300 TOPS và là công cụ tuyệt vời cho các tác vụ AI. Tuy nhiên, các đối thủ cạnh tranh như Microsoft, Intel, Qualcomm và Apple sẽ không dễ dàng đầu hàng, và cuộc cạnh tranh trên thị trường NPU sẽ ngày càng khốc liệt hơn.

Không có file đính kèm.

Nguồn tham khảo

114

AI chips-hardware-compute AI PC 2024-05-02 07:23:48

cập nhật đột phá của Nvidia ChatRTX: Tìm kiếm ảnh và nhận dạng giọng nói AI

- Nvidia ChatRTX đã phát hành bản cập nhật 0.3 vào ngày hôm nay, mang đến nhiều tính năng mới được giới thiệu lần đầu tại hội nghị GTC của Nvidia vào tháng Ba.
- Các tính năng mới bao gồm khả năng tìm kiếm ảnh, nhận dạng giọng nói AI và tương thích với nhiều LLM hơn, như Gemma từ Google và ChatGLM3-6B, một lựa chọn nguồn mở mới.
- ChatRTX cung cấp trải nghiệm tương tự như ChatGPT nhưng được cài đặt trực tiếp trên máy tính cá nhân, cho phép tận dụng dữ liệu cá nhân mà không lo ngại dữ liệu bị đánh cắp.
- Một ví dụ về ứng dụng thực tế của chương trình là việc một người đam mê đã lắp đặt thẻ RTX vào NAS để sử dụng khả năng tổng hợp dữ liệu của ChatRTX trên toàn bộ mạng dữ liệu của họ.
- Công nghệ tìm kiếm ảnh của ChatRTX đã được cải tiến đáng kể, sử dụng công nghệ từ công cụ CLIP của OpenAI, cho phép tìm kiếm hình ảnh mà không cần phải gắn nhãn metadata phức tạp như trước.
- Hỗ trợ mới cho Whisper, hệ thống nhận dạng giọng nói AI, cho phép ChatRTX hiểu được lời nói.
- Dự kiến, chương trình sẽ tiếp tục phát triển thêm nhiều chức năng trước khi phát hành chính thức phiên bản 1.0, bao gồm cả khả năng quét liên kết YouTube đã bị gỡ bỏ gần đây sau các bản cập nhật khẩn cấp 0.2.x để vá lỗ hổng bảo mật.

📌 Bản cập nhật 0.3 của Nvidia ChatRTX mang đến các tính năng mới như tìm kiếm ảnh nâng cao, nhận dạng giọng nói AI và tương thích với nhiều LLM hơn, bao gồm Gemma và ChatGLM3-6B. Cải tiến này mở rộng khả năng của ChatRTX, cho phép người dùng tương tác với dữ liệu một cách an toàn và hiệu quả hơn.

Citations:
[1] https://www.tomshardware.com/tech-industry/artificial-intelligence/nvidias-chatrtx-receives-major-update-better-photo-search-ai-speech-recognition-and-more-llm-options

Không có file đính kèm.

Nguồn tham khảo

162

AI chips-hardware-compute 2024-05-02 02:29:19

Giá GPU Nvidia H100 trên thị trường chợ đen ở Trung Quốc giảm mạnh dù bị cấm bởi lệnh trừng phạt của Mỹ nhưng vẫn có sẵn.

- Giá của bộ xử lý Nvidia H100 dành cho ứng dụng AI và HPC, cũng như máy chủ sử dụng GPU này, đã thiết lập kỷ lục vào năm ngoái do nguồn cung hạn chế.
- Tuy nhiên, khi nguồn cung cải thiện và nhu cầu giảm xuống khi thị trường chuẩn bị cho sự ra mắt của GPU H200 và máy chủ mới, giá của H100 đã bắt đầu giảm.
- Mặc dù có lệnh cấm từ chính phủ Mỹ đối với việc bán GPU A100/A800 và H100/H800, những GPU này vẫn được bán trên thị trường chợ đen ở Trung Quốc thông qua các kênh ngầm như đại lý mua hàng và công ty ma nhập khẩu các bộ xử lý và máy chủ từ nơi khác vào đại lục.
- Đặc biệt, việc mua GPU H100 tại thị trường điện tử Huaqiangbei ở phía bắc Thâm Quyến được cho là khá dễ dàng, mặc dù giá cả cao hơn nhiều so với giá chính thức của Nvidia.
- Vào một thời điểm, máy chủ dựa trên H100 được báo giá hơn 3 triệu nhân dân tệ (hơn 420.000 đô la Mỹ), cao hơn khoảng 50% so với giá chính thức của Nvidia là 280.000 đến 300.000 đô la Mỹ.
- Sự gia tăng giá này đã cho phép các trung gian thu lợi nhuận lớn, ngay cả sau khi tính đến các chi phí bổ sung như logistics và thuế quan.
- Mặc dù Nvidia H200 sắp ra mắt được kỳ vọng là sản phẩm mạnh mẽ hơn nhiều so với H100, nhưng H100 vẫn là một phần cứng hữu ích, đặc biệt là cho các tác vụ suy luận học sâu.
- Nvidia có khả năng sẽ tiếp tục bán sản phẩm dựa trên Hopper thế hệ đầu tiên của mình trong một thời gian.
- TSMC hiện có nhiều công suất CoWoS hơn và có thể sản xuất đủ số lượng bộ xử lý H100 và H200 để đáp ứng nhu cầu dự kiến.
- Mặc dù vậy, cả H100 và H200 mới hơn không được phép xuất khẩu sang Trung Quốc. Sau các báo cáo về sự sẵn có của H100 tại Trung Quốc, Nvidia đã tái khẳng định sự tuân thủ các quy định xuất khẩu của Mỹ, nhấn mạnh rằng việc bán và phân phối sản phẩm của họ...

📌 Giá của GPU Nvidia H100 trên thị trường chợ đen ở Trung Quốc đã giảm mạnh do cải thiện nguồn cung và giảm nhu cầu, mặc dù vẫn bị cấm xuất khẩu bởi Mỹ. H100 vẫn được bán qua các kênh ngầm cao hơn khoảng 50% so với giá chính thức của Nvidia và được dự đoán sẽ tiếp tục có mặt trên thị trường do nhu cầu với các tác vụ AI.

Citations:
[1] https://www.tomshardware.com/tech-industry/artificial-intelligence/nvidia-h100-gpu-black-market-prices-drop-in-china-banned-by-us-sanctions-but-still-available

Không có file đính kèm.

Nguồn tham khảo

178

AI chips-hardware-compute 2024-04-30 11:43:05

Mỹ giải thích lý do không "kìm chân" Trung Quốc qua việc cấp phép chip Intel cho laptop Huawei

- Ngày 29 tháng 4 năm 2024, Ngoại trưởng Mỹ Antony Blinken đã phát biểu trên NPR, khẳng định rằng các hạn chế thương mại của Hoa Kỳ đối với Trung Quốc và các công ty công nghệ Trung Quốc không nhằm "kiềm chế hay ngăn cản" sự phát triển của Trung Quốc.
- Phát biểu này được đưa ra sau thông tin Huawei ra mắt laptop mới sử dụng chip Meteor Lake của Intel, cho thấy Mỹ chỉ tập trung vào công nghệ nhạy cảm có thể đe dọa an ninh quốc gia.
- Blinken nhấn mạnh rằng Mỹ không tập trung vào việc cắt đứt thương mại hay kiềm chế Trung Quốc, mà chỉ ngăn chặn những công nghệ cực kỳ nhạy cảm.
- Huawei đã phục hồi mạnh mẽ sau khi bị Mỹ đặt các biện pháp trừng phạt nghiêm ngặt vào năm 2020, với doanh số tăng 11% tại Trung Quốc vào năm 2023.
- Các nhà lập pháp Mỹ, như Dân biểu Michael McCaul (R-TX), đã kêu gọi hạn chế sản xuất chip của Trung Quốc để gây tổn hại cho đất nước này trên phạm vi rộng hơn, bao gồm cả việc ngăn chặn Trung Quốc tiếp cận với giao thức chip nguồn mở RISC-V.
- Huawei được phép yêu cầu Intel sản xuất chip cho họ nhưng là các thế hệ cũ hơn, ví dụ như chip thế hệ thứ 12.

📌 Ngoại trưởng Mỹ Antony Blinken khẳng định các biện pháp trừng phạt đối với Trung Quốc không nhằm ngăn cản sự phát triển của nước này, mà chỉ nhằm vào công nghệ nhạy cảm. Huawei đã tăng trưởng 11% tại Trung Quốc vào năm 2023, cho thấy sự phục hồi mạnh mẽ dù chịu nhiều hạn chế từ Mỹ.

Citations:
[1] https://www.tomshardware.com/tech-industry/us-justifies-huaweis-intel-powered-laptops-saying-chip-bans-arent-meant-to-hobble-chinas-growth

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2024-04-29 18:46:16

Điều tra của Mỹ về RISC-V Trung Quốc đe dọa kế hoạch chip AI và bán dẫn của Samsung

- Samsung Electronics đang tích cực quảng bá kiến trúc tập lệnh nguồn mở RISC-V như một công nghệ quan trọng để phát triển chip AI thế hệ tiếp theo.
- Tuy nhiên, cuộc điều tra đang diễn ra của Bộ Thương mại Mỹ (DOC) về các rủi ro an ninh quốc gia tiềm ẩn do sự tham gia tích cực của Trung Quốc vào RISC-V có thể cản trở các kế hoạch phát triển hệ sinh thái RISC-V của Samsung.
- DOC đang tiến hành điều tra về các rủi ro an ninh quốc gia có thể xảy ra liên quan đến sự hiện diện đáng kể của Trung Quốc trong lĩnh vực RISC-V, đồng thời đánh giá các biện pháp đối phó có thể trong khi nhấn mạnh sự cần thiết phải tránh gây tổn hại cho các công ty Mỹ tham gia phát triển RISC-V.
- Các nhà phân tích ngành công nghiệp nhấn mạnh sự cần thiết DOC phải cân nhắc kỹ lưỡng hàm ý của bất kỳ quyết định nào liên quan đến RISC-V, do sự tham gia của nhiều công ty Mỹ trong quá trình phát triển nó.
- Để kết hợp RISC-V vào thiết kế IC, gần đây Samsung đã thành lập một tổ chức R&D thiết kế chip AI có tên "Advanced Processor Lab (APL)" tại Thung lũng Silicon nhằm đẩy nhanh việc phát triển các chip AI độc quyền của Samsung sử dụng kiến trúc nguồn mở RISC-V.
- Với việc Mỹ bắt đầu điều tra công nghệ RISC-V, ngành công nghiệp Hàn Quốc lo ngại rằng việc thiết kế IC RISC-V của Samsung có thể gặp trở ngại ngay khi nó mới bắt đầu. Nếu các công ty công nghệ lớn của Mỹ rút lui khỏi việc phát triển RISC-V dưới áp lực từ chính phủ Mỹ, sẽ rất khó cho các công ty Trung Quốc và Hàn Quốc độc lập sản xuất CPU có thể cạnh tranh với các sản phẩm của Arm.
- Từ góc nhìn dài hạn hơn, nếu chính phủ Mỹ thực thi các hạn chế về việc áp dụng RISC-V, điều này cũng có thể ảnh hưởng tiêu cực đến hoạt động kinh doanh giải pháp bán dẫn của Samsung, đặc biệt là tầm quan trọng của thị trường Trung Quốc trong nỗ lực mở rộng thị phần giải pháp bán dẫn của công ty.

📌 Cuộc điều tra của Mỹ về vai trò của Trung Quốc trong RISC-V đang đe dọa nghiêm trọng tham vọng phát triển chip AI và mở rộng kinh doanh giải pháp bán dẫn của Samsung. Nếu các công ty công nghệ lớn của Mỹ rút lui khỏi RISC-V dưới áp lực từ chính phủ, Samsung sẽ khó độc lập sản xuất CPU cạnh tranh được với Arm, đồng thời ảnh hưởng tiêu cực tới hoạt động kinh doanh giải pháp bán dẫn của hãng tại thị trường quan trọng Trung Quốc.

Citations:
[1] https://www.digitimes.com/news/a20240429PD201/us-china-risc-v-samsung-ai-chip-foundry-expansion.html

Không có file đính kèm.

Nguồn tham khảo

110

Semi-Cloud-DC-Green AI chips-hardware-compute 2024-04-28 12:17:05

Maruwa: Từ gốm cổ truyền Nhật Bản đến ngôi sao sáng của thời đại AI

- Công ty sản xuất gốm Maruwa của Nhật Bản đang đóng vai trò quan trọng trong việc làm mát các trung tâm dữ liệu giữa làn sóng bùng nổ của AI.
- Cổ phiếu của Maruwa đã tăng gấp đôi trong năm qua, theo báo cáo của Financial Times.
- Lịch sử 200 năm trong ngành gốm đã giúp Maruwa có lợi thế cạnh tranh.
- Sự bùng nổ của AI đang thúc đẩy việc xây dựng trung tâm dữ liệu, tiêu thụ lượng lớn năng lượng.
- Dự kiến đến năm 2030, các trung tâm dữ liệu sẽ tiêu thụ 35 gigawatt điện hàng năm, tăng từ 17 gigawatt vào năm 2022, theo McKinsey & Company.
- Khoảng 40% năng lượng được sử dụng để làm mát máy chủ, theo ước tính của McKinsey.
- Maruwa, với kinh nghiệm sản xuất gốm cho bo mạch và bán dẫn, đã chứng kiến cổ phiếu của mình tăng gấp đôi trong năm qua.
- Công ty cho biết sức mạnh của họ nằm ở việc xây dựng vật liệu có khả năng tản nhiệt tốt.
- "Nhu cầu về tản nhiệt đang tăng nhanh chóng do truyền thông tốc độ cao tại các trung tâm dữ liệu, và công ty chúng tôi có lợi thế cạnh tranh mạnh mẽ trong lĩnh vực này," người phát ngôn của Maruwa chia sẻ với Business Insider.
- Maruwa dự đoán rằng truyền thông tốc độ cao thế hệ tiếp theo, bao gồm cả liên quan đến AI tạo sinh, sẽ là động lực chính thúc đẩy sự tăng trưởng kinh doanh của họ trong những năm tới.
- Lợi thế cạnh tranh của Maruwa bắt nguồn từ lịch sử lâu dài của họ, với nguồn gốc từ đầu thế kỷ 19 và ban đầu sản xuất đồ ăn cho ẩm thực Nhật Bản trước khi chuyển sang linh kiện điện tử vào những năm 1960.

📌 Maruwa, công ty gốm có lịch sử 200 năm, đang nắm bắt cơ hội từ cuộc cách mạng AI bằng việc cung cấp giải pháp làm mát cho trung tâm dữ liệu. Với sự tăng trưởng mạnh mẽ của cổ phiếu và dự đoán tiêu thụ điện năng lên đến 35 gigawatt vào năm 2030, Maruwa đang chứng tỏ khả năng tản nhiệt vượt trội, hứa hẹn trở thành động lực chính cho sự phát triển kinh doanh trong tương lai.

Citations:
[1] https://www.businessinsider.com/centuries-old-japanese-ceramics-maker-maruwa-ai-revolution-2024-4

Không có file đính kèm.

Nguồn tham khảo

117

AI chips-hardware-compute 2024-04-28 07:05:58

Huawei thúc đẩy sản xuất bộ nhớ HBM cho phát triển AI tại Trung Quốc để vượt qua lệnh trừng phạt Mỹ

- Huawei đang hậu thuẫn việc sản xuất bộ nhớ băng thông cao (HBM) tại một nhà sản xuất DRAM Trung Quốc để thoát khỏi các lệnh trừng phạt của phương Tây.
- HBM đóng vai trò quan trọng đối với các bộ xử lý AI và HPC vì hiệu suất thường bị giới hạn bởi băng thông bộ nhớ.
- Liên minh do Huawei dẫn đầu được chính phủ Trung Quốc hậu thuẫn và bao gồm nhiều công ty bán dẫn Trung Quốc khác như Fujian Jinhua Integrated Circuit.
- Liên minh hiện đang phát triển bộ nhớ HBM2, thế hệ cũ hơn so với các nhà sản xuất hàng đầu thị trường.
- Huawei đặt mục tiêu hoàn thành việc phát triển và bắt đầu sản xuất hàng loạt bộ nhớ HBM2 vào năm 2026.
- ChangXin Memory Technologies (CXMT) cũng đang nỗ lực phát triển HBM.
- Huawei cần HBM cho các bộ xử lý Ascend dành cho ứng dụng AI, nhưng tính sẵn có của HBM là một nút thắt cổ chai.
- Nỗ lực của Huawei và các công ty HBM khác phải đối mặt với những trở ngại đáng kể, đặc biệt là các quy định quốc tế hạn chế bán thiết bị chế tạo chip tiên tiến cho Trung Quốc.

📌 Huawei đang dẫn đầu liên minh gồm nhiều công ty bán dẫn Trung Quốc để sản xuất bộ nhớ HBM2 vào năm 2026, nhằm vượt qua lệnh trừng phạt của Mỹ và thúc đẩy phát triển AI. Tuy nhiên, họ phải đối mặt với nhiều trở ngại do các quy định quốc tế hạn chế bán thiết bị sản xuất chip tiên tiến cho Trung Quốc.

Citations:
[1] https://www.tomshardware.com/pc-components/dram/huawei-backs-development-of-hbm-memory-in-china-new-consortium-aims-to-sidestep-us-sanctions

Không có file đính kèm.

Nguồn tham khảo

130

AI chips-hardware-compute 2024-04-26 06:19:32

CEO NVIDIA Jensen Huang trao tận tay siêu máy tính DGX H200 đầu tiên cho OpenAI

- NVIDIA đã giao hệ thống siêu máy tính DGX H200 đầu tiên cho OpenAI, đánh dấu một cột mốc quan trọng trong quan hệ đối tác giữa hai công ty.
- DGX H200 là hệ thống máy tính mạnh nhất thế giới dành cho AI tạo sinh, với 32 GPU H100 và tốc độ xử lý lên tới 1 exaflop.
- CEO NVIDIA Jensen Huang đã đích thân giao hệ thống này cho OpenAI, thể hiện tầm quan trọng của mối quan hệ hợp tác giữa hai bên.
- OpenAI đã sử dụng các hệ thống DGX của NVIDIA để huấn luyện các mô hình AI đột phá như ChatGPT và GPT-4.
- Hệ thống DGX H200 mới sẽ giúp OpenAI đẩy nhanh quá trình phát triển và mở rộng quy mô các mô hình AI tạo sinh trong tương lai.
- NVIDIA cũng đang hợp tác với các công ty và tổ chức khác như Microsoft, Google và Trung tâm Siêu máy tính Texas để thúc đẩy sự phát triển của AI tạo sinh.
- Việc giao hệ thống DGX H200 cho OpenAI cho thấy NVIDIA đang đi đầu trong cuộc đua phát triển phần cứng và hạ tầng cho AI tạo sinh.

📌CEO NVIDIA Jensen Huang trao tận tay hệ thống siêu máy tính DGX H200 mạnh nhất thế giới cho OpenAI, thể hiện mối quan hệ đối tác chặt chẽ giữa hai công ty trong lĩnh vực AI tạo sinh. Hệ thống này sẽ giúp OpenAI đẩy nhanh quá trình phát triển các mô hình AI đột phá như ChatGPT và GPT-4, đồng thời khẳng định vị thế dẫn đầu của NVIDIA trong cuộc đua cung cấp hạ tầng cho AI tạo sinh.

Citations:
[1] https://venturebeat.com/ai/nvidia-ceo-jensen-huang-personally-delivers-first-dgx-h200-to-openai/

Không có file đính kèm.

Nguồn tham khảo

130

AI chips-hardware-compute 2024-04-25 06:18:36

Siêu máy tính mới thúc đẩy cuộc cách mạng AI

- Sự bùng nổ của AI tạo sinh hiện nay được thúc đẩy bởi sự gia tăng đáng kinh ngạc về khả năng của các vi mạch. Ngày nay, một mạng lưới các máy chủ có thể thực hiện các phép tính trên các tập dữ liệu cực lớn.
- Bài viết thảo luận về những đổi mới đáng kinh ngạc giúp Nvidia trở thành người chơi hàng đầu trong lĩnh vực công nghệ trên nhiều mặt trận.
- Để phát triển lĩnh vực AI tạo sinh, cần có các trung tâm dữ liệu rất lớn. Một máy chủ AI điển hình được xây dựng xung quanh một bộ xử lý trung tâm, chip nhớ và bộ xử lý được thiết kế để tính toán nhanh.
- Có nhiều đổi mới dẫn đến tốc độ nhanh hơn và khả năng tính toán mạnh hơn. Các máy chủ có thể làm việc cùng nhau để thực hiện phân tích chung trên các tập dữ liệu cực lớn.
- Những phát triển đáng chú ý trong lĩnh vực này là các card tăng tốc Nvidia và gần đây là AMD (GPU), bao gồm các bộ xử lý cực nhanh. Chúng cung cấp sức mạnh tính toán cần thiết để tính toán các mô hình AI mới nhất.
- Định luật Moore cho rằng số lượng bóng bán dẫn trên một vi mạch (cung cấp sức mạnh tính toán) sẽ tăng gấp đôi sau mỗi 2 năm. Vì vậy, dự kiến sẽ có những tiến bộ hơn nữa về tốc độ tính toán, cho phép các mô hình phức tạp hơn.

📌 Sự gia tăng đáng kinh ngạc về tốc độ tính toán, được thúc đẩy bởi các vi mạch máy chủ nhanh, đang là động lực chính cho sự bùng nổ AI tạo sinh hiện nay. Nvidia đang dẫn đầu xu hướng này với các GPU cực nhanh.

Citations:
[1] https://think.ing.com/articles/ai-a-revolution-driven-by-new-supercomputers/

#hay (hình vẽ)

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2024-04-24 06:44:47

Trung Quốc đã mua được chip AI Nvidia bị hạn chế của Mỹ từ Super Micro, Dell và Gigabyte

- Phân tích của Reuters cho thấy 11 nhà bán lẻ Trung Quốc đã mua được chip AI Nvidia bị Mỹ hạn chế xuất khẩu.

- Các chip này được tích hợp trong máy chủ của Super Micro Computer, Dell Technologies và Gigabyte Technology.

- Nvidia cho biết các giao dịch này chỉ chiếm một phần nhỏ trong tổng số sản phẩm bán ra toàn cầu.

- Các nhà sản xuất máy chủ khẳng định tuân thủ quy định xuất khẩu của Mỹ về GPU.

- Giá trị giao dịch từ 71.500 - 1,86 triệu nhân dân tệ (khoảng 10.000 - 259.000 USD).

- Chưa rõ các nhà bán lẻ Trung Quốc mua từ nguồn hàng tồn kho cũ hay sau khi lệnh cấm xuất khẩu có hiệu lực.

📌 Mặc dù Mỹ hạn chế xuất khẩu nhưng Trung Quốc vẫn mua được chip AI Nvidia qua các nhà bán lẻ, tích hợp trong máy chủ của các hãng lớn với giá trị lên tới 259.000 USD.

Citations:

[1] https://www.scmp.com/tech/tech-war/article/3260021/tech-war-china-acquired-us-restricted-nvidia-ai-chips-super-micro-dell-and-gigabyte-technology

Không có file đính kèm.

Nguồn tham khảo

119

AI chips-hardware-compute 2024-04-23 07:37:27

Giải mã Language Processing Unit (LPU) và vai trò của nó trong phần cứng AI

- Language Processing Unit (LPU) là một bước tiến đột phá trong công nghệ bộ xử lý, được thiết kế đặc biệt để tối ưu hóa các tác vụ liên quan đến xử lý ngôn ngữ tự nhiên (NLP).
- Khác với CPU và GPU đa năng, LPU được điều chỉnh phù hợp cho nhu cầu xử lý tuần tự vốn có trong việc hiểu và tạo ra ngôn ngữ của con người.
- Sự chuyên biệt hóa này mang lại những cải tiến đáng kể về hiệu quả và hiệu suất cho các ứng dụng dựa trên ngôn ngữ.
- LPU là phần cứng chuyên dụng được thiết kế để xuất sắc trong các tác vụ xử lý ngôn ngữ. Nó tích hợp các thiết kế kiến trúc tiên tiến ưu tiên xử lý dữ liệu tuần tự, điều này rất quan trọng để hiểu và tạo ra ngôn ngữ chính xác.
- LPU ngày càng phù hợp trong thế giới kỹ thuật số ngày nay, nơi các tác vụ tập trung vào ngôn ngữ, từ dịch thời gian thực đến tạo nội dung tự động, đang phổ biến.
- Các tính năng đặc biệt của LPU bao gồm: Chuyên biệt hóa tác vụ, tối ưu hóa cho xử lý ngôn ngữ.
- Vai trò của phần cứng chuyên dụng như LPU ngày càng trở nên quan trọng. Với sự tiến bộ của các mô hình AI, đặc biệt là những mô hình liên quan đến AI tạo sinh và hội thoại, nhu cầu về các đơn vị xử lý chuyên biệt và hiệu quả như LPU dự kiến sẽ tăng lên.
- Phần cứng chuyên dụng này cuối cùng có thể dẫn đến việc áp dụng rộng rãi khi các ngành công nghiệp nhận ra lợi ích về hiệu quả và chi phí của các giải pháp bộ xử lý được điều chỉnh riêng.

📌 LPU đánh dấu một bước tiến đáng kể trong công nghệ bộ xử lý, đặc biệt phục vụ cho lĩnh vực xử lý ngôn ngữ tự nhiên đang phát triển mạnh mẽ. Với thiết kế chuyên biệt và hiệu suất tối ưu, LPU hứa hẹn một tương lai nơi các tác vụ ngôn ngữ được xử lý với hiệu quả và tốc độ chưa từng có.

Citations:
[1] https://www.marktechpost.com/2024/04/22/what-is-the-language-processing-unit-lpu-its-role-in-ai-hardware/

Không có file đính kèm.

Nguồn tham khảo

190

AI chips-hardware-compute Semi-Cloud-DC-Green 2024-04-21 07:20:31

Đầu tư tư nhân đang dẫn đầu cuộc đua xây dựng cơ sở hạ tầng cho AI

- Các công ty đầu tư tư nhân như Blackstone, Carlyle Group và KKR đang âm thầm đầu tư hàng chục tỷ đô la vào các dự án năng lượng và trung tâm dữ liệu để đáp ứng nhu cầu cơ sở hạ tầng cho AI.
- Họ kỳ vọng sẽ thu được lợi nhuận lớn khi nhu cầu từ AI tăng vọt trong tương lai.
- Blackstone là một trong những công ty tiên phong, mua lại nhà cung cấp trung tâm dữ liệu QTS với giá khoảng 10 tỷ đô la vào năm 2021. CEO Stephen Schwarzman tiết lộ công ty đã đầu tư 50 tỷ đô la vào trung tâm dữ liệu.
- Trung tâm dữ liệu, nơi các nhà phát triển sử dụng để huấn luyện các mô hình ngôn ngữ lớn đằng sau AI, tiêu thụ một lượng năng lượng khổng lồ. Dự kiến đến năm 2030, chúng có thể chiếm tới 15% tổng nhu cầu điện toàn cầu.
- Carlyle Group đã đầu tư 2 tỷ đô la vào một dự án năng lượng mặt trời gần Phoenix, một trung tâm sản xuất chip, nhằm thu hút thêm các nhà máy từ các nhà cung cấp chip AI hàng đầu như TSMC.
- Pooja Goyal, người đứng đầu mảng năng lượng tái tạo của Carlyle, chia sẻ rằng họ đã không tính đến nhu cầu kéo từ AI đang diễn ra ngay lúc này khi đầu tư vào các dự án năng lượng.

📌 Các công ty đầu tư tư nhân đang đi đầu trong cuộc đua xây dựng cơ sở hạ tầng cho AI với khoản đầu tư hàng chục tỷ đô la vào trung tâm dữ liệu và dự án năng lượng. Họ kỳ vọng sẽ thu lợi nhuận lớn khi nhu cầu từ AI tăng vọt, dự kiến chiếm tới 15% tổng nhu cầu điện toàn cầu vào năm 2030.

Citations:
[1] https://fortune.com/2024/04/19/ai-infrastructure-energy-data-centers-private-equity-blackstone-carlyle-kkr/

Không có file đính kèm.

Nguồn tham khảo

115

AI chips-hardware-compute Semi-Cloud-DC-Green 2024-04-21 06:51:24

AMD và Intel dẫn đầu cuộc cách mạng AI trong các trung tâm dữ liệu, nêu bật những bước đột phá GPU tiên tiến

- Tại Data Center World 2024, các giám đốc điều hành từ AMD và Intel nhấn mạnh vai trò then chốt của AI và GPU tiên tiến trong việc cách mạng hóa hoạt động trung tâm dữ liệu.
- Họ đề cập đến những tiến bộ mới nhất về AI và GPU, cải thiện hiệu quả năng lượng, tự động hóa dựa trên AI và chuyển đổi cơ sở hạ tầng trung tâm dữ liệu để đáp ứng nhu cầu ngày càng tăng của AI.
- Jennifer Majernik Huffstetler từ Intel nhấn mạnh tiềm năng chuyển đổi của AI phụ thuộc vào sự kết hợp của bộ xử lý mạnh mẽ, phần cứng và phần mềm tiết kiệm năng lượng, và các mô hình GenAI được tùy chỉnh cho các ứng dụng cụ thể.
- Bà nhấn mạnh rằng phần lớn dữ liệu vẫn tiếp tục được xử lý tại chỗ và ủng hộ việc phát triển các mô hình nhỏ hơn, dành riêng cho từng lĩnh vực để giải quyết các nhu cầu cụ thể của doanh nghiệp.
- Huffstetler cũng nhấn mạnh tầm quan trọng của các giải pháp làm mát sáng tạo, như làm mát bằng chất lỏng, để giảm tiêu thụ năng lượng lên đến 40%.
- Laura Smith từ AMD thừa nhận rằng các trung tâm dữ liệu hiện tại chưa sẵn sàng cho việc tích hợp AI do những hạn chế cấu trúc vốn có. Bà kêu gọi nâng cấp để đáp ứng các tiến bộ của AI.
- Các nhà phân tích nhấn mạnh vị thế chiến lược của AMD trong bối cảnh điện toán đang phát triển, nêu bật những lợi thế đáng kể của họ trên thị trường CPU máy chủ và thành công trong việc giành thị phần trên thị trường bộ tăng tốc thương mại với dòng Mi300.
- Họ cũng chỉ ra tiềm năng chưa được khai thác của các hiệp lực doanh thu từ việc mua lại Xilinx, ngụ ý mức tăng dài hạn hơn 10 tỷ USD.

📌 AMD và Intel đang dẫn đầu cuộc cách mạng AI trong các trung tâm dữ liệu với những bước đột phá về GPU tiên tiến, cải thiện hiệu quả năng lượng lên đến 40%, tự động hóa dựa trên AI và chuyển đổi cơ sở hạ tầng. Các nhà phân tích nhấn mạnh vị thế chiến lược của AMD với lợi thế đáng kể trên thị trường CPU máy chủ, thành công trong việc giành thị phần bộ tăng tốc thương mại và tiềm năng tăng trưởng doanh thu hơn 10 tỷ USD từ thương vụ mua lại Xilinx.

Citations:
[1] https://www.benzinga.com/news/24/04/38320280/amd-and-intel-lead-the-ai-revolution-in-data-centers-highlighting-advanced-gpu-breakthroughs

Không có file đính kèm.

Nguồn tham khảo

127

AI chips-hardware-compute Semi-Cloud-DC-Green 2024-04-20 02:56:28

Microsoft sẵn sàng "bùng nổ" với kế hoạch mở rộng trung tâm dữ liệu khổng lồ để thúc đẩy cơn sốt AI

- Microsoft đang lên kế hoạch mở rộng đáng kể công suất trung tâm dữ liệu của mình để đáp ứng nhu cầu ngày càng tăng về trí tuệ nhân tạo (AI).
- Theo tài liệu nội bộ mà Insider có được, Microsoft dự định tăng gấp đôi công suất Azure trong nửa cuối của năm tài chính hiện tại và tăng gấp ba trong nửa đầu của năm tài chính tiếp theo.
- Cơ sở hạ tầng trung tâm dữ liệu của Microsoft đang chịu áp lực ngày càng tăng do nhu cầu về mô hình nền tảng và AI tạo sinh.
- Microsoft đã tăng gấp đôi số lượng bộ tăng tốc đã cài đặt trong năm qua để đáp ứng nhu cầu cao về AI.
- Công ty đang tích cực làm việc để đảm bảo một số lượng lớn GPU nhằm tăng cường khả năng xử lý tải công việc AI.
- Mặc dù chưa có thông báo chính thức, các phát triển gần đây cho thấy Microsoft có ý định mở rộng dấu ấn trung tâm dữ liệu của mình.
- Một quảng cáo tuyển dụng được đăng tải vào đầu năm nay đã hé lộ ý định của Microsoft mở rộng sự hiện diện tại khu vực Châu Á-Thái Bình Dương.
- Báo cáo mới nhất của Synergy Research Group chỉ ra rằng hơn một nửa (51%) tổng công suất trung tâm dữ liệu hiện đang đặt tại Hoa Kỳ.
- Châu Á-Thái Bình Dương chiếm 26% tổng công suất, trong đó Trung Quốc chiếm khoảng 62% trong số đó.
- Châu Âu đứng sau, chiếm 17% tổng công suất.
- Synergy Research Group dự báo công suất trung tâm dữ liệu sẽ tăng gấp đôi trong 4 năm tới, với AI tạo sinh là động lực chính thúc đẩy sự tăng trưởng này.

📌 Microsoft đang mở rộng mạnh mẽ công suất trung tâm dữ liệu để đáp ứng nhu cầu về AI, với kế hoạch tăng gấp đôi và gấp ba công suất Azure. Công ty cũng đang tăng cường khả năng xử lý AI bằng cách đảm bảo số lượng lớn GPU và mở rộng sự hiện diện tại Châu Á-Thái Bình Dương. Báo cáo mới nhất của Synergy Research Group chỉ ra rằng hơn một nửa (51%) tổng công suất trung tâm dữ liệu hiện đang đặt tại Hoa Kỳ. Châu Á-Thái Bình Dương chiếm 26% tổng công suất, trong đó Trung Quốc chiếm khoảng 62% trong số đó. Châu Âu đứng sau, chiếm 17% tổng công suất. dự báo công suất trung tâm dữ liệu sẽ tăng gấp đôi trong 4 năm tới, với AI tạo sinh là động lực chính thúc đẩy sự tăng trưởng này.

Citations:
[1] https://www.techradar.com/pro/microsoft-has-huge-plans-to-expand-its-data-center-output-to-fuel-ai-boom

#hay

Không có file đính kèm.

Nguồn tham khảo

127

AI chips-hardware-compute 2024-04-20 02:40:55

Ấn Độ bứt phá: Từ nhập khẩu đến tự sản xuất máy chủ AI

- Ấn Độ đã chuyển từ nhập khẩu và lắp ráp máy chủ sang sản xuất máy chủ trong nước nhờ chương trình khuyến khích sản xuất liên kết (PLI) cho phần cứng CNTT.
- Mega Networks là công ty đầu tiên tại Ấn Độ sản xuất thành công máy chủ sử dụng bộ vi xử lý Intel Xeon Scalable thế hệ thứ 4, dành cho HPC, trung tâm dữ liệu và AI tạo sinh, với việc được cấp PLI vào ngày 18 tháng 11 năm 2023 và ra mắt sản phẩm vào ngày 31 tháng 12 năm 2023.
- Tính đến tháng 2 năm 2023, không có công ty đa quốc gia hay OEM địa phương nào khác tại Ấn Độ có thể sản xuất máy chủ trên nền tảng công nghệ mới nhất này.
- Altos Computing, một công ty con của Acer, cũng đang tích cực sản xuất máy chủ tại Ấn Độ, với 50% linh kiện và máy chủ được phát triển trong nước.
- Sự phát triển của hệ sinh thái sản xuất máy chủ tại Ấn Độ dự kiến sẽ tiếp tục tăng trưởng, với kỳ vọng tỷ lệ phần trăm máy chủ sản xuất trong nước sẽ còn cao hơn nữa.
- Sự bùng nổ của AI tạo sinh đã thúc đẩy nhu cầu về máy chủ mạnh mẽ, có khả năng mở rộng và hiệu quả tại Ấn Độ, đặc biệt là từ những người dùng trước đây không sử dụng máy chủ.
- Cơ sở hạ tầng vật lý hiện tại của Ấn Độ cũng rất vững chắc và hỗ trợ cho sự phát triển này.

📌 Ấn Độ đã chuyển từ nhập khẩu sang tự sản xuất máy chủ AI, với Mega Networks và Altos Computing là những công ty tiên phong. Mega Networks đã sản xuất thành công máy chủ với bộ vi xử lý Intel Xeon Scalable thế hệ thứ 4, và Altos Computing đang phát triển 50% máy chủ và linh kiện trong nước, hứa hẹn sự tăng trưởng mạnh mẽ trong tương lai.

Citations:
[1] https://analyticsindiamag.com/india-is-making-its-own-ai-servers/

Không có file đính kèm.

Nguồn tham khảo

107

AI chips-hardware-compute 2024-04-18 00:22:59

GPU Nvidia A100 "nâng cao" xuất hiện ở Trung Quốc với 7.936 nhân CUDA, 96GB HBM2

- Nhiều người bán ở Trung Quốc đang bán GPU Nvidia A100 7936SP trên eBay với mức giá từ 18.000 đến 19.800 USD cho phiên bản 96GB.

- Không rõ liệu các bộ tăng tốc này có phải là mẫu kỹ thuật thoát ra từ phòng thí nghiệm của Nvidia, hay là các mẫu tùy chỉnh mà nhà sản xuất chip phát triển cho một khách hàng cụ thể.

- Mặc dù có thể chịu các lệnh trừng phạt xuất khẩu mới nhất của Mỹ, điều đó không ảnh hưởng đến các card đã có sẵn ở Trung Quốc.

- A100 7936SP chia sẻ cùng die Ampere GA100 với A100 thông thường, nhưng có 124 SM (Streaming Multiprocessor) được kích hoạt trên tổng số 128 SM có thể trên silicon GA100.

- A100 7936SP có nhiều nhân CUDA hơn 15% so với A100 tiêu chuẩn, đại diện cho một cải tiến đáng kể.

- Nvidia có thể đã thử nghiệm một phiên bản nâng cao chưa từng xuất hiện trên thị trường, hoặc các công ty đã bí mật sửa đổi A100 để làm cho nó nhanh hơn trong bối cảnh các lệnh trừng phạt của Mỹ đối với Trung Quốc.

📌 Các GPU Nvidia A100 "nâng cao" với 7.936 nhân CUDA và 96GB bộ nhớ HBM2 đã xuất hiện trên thị trường hàng đã qua sử dụng của Trung Quốc, vượt trội hơn 15% so với phiên bản tiêu chuẩn. Giá bán dao động từ 18.000 - 19.800 USD. Sự xuất hiện của chúng gây tò mò về nguồn gốc và khả năng Nvidia đã thử nghiệm phiên bản này trước khi các lệnh trừng phạt với Trung Quốc được áp dụng.

Citations:

[1] 'Enhanced' Nvidia A100 GPUs appear in China's second-hand market — new cards surpass sanctioned counterparts with 7,936 CUDA cores and 96GB HBM2 memory https://www.tomshardware.com/pc-components/gpus/enhanced-nvidia-a100-gpus-appear-in-chinas-second-hand-market-new-cards-surpass-sanctioned-counterparts-with-7936-cuda-cores-and-96gb-hbm2-memory

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2024-04-17 22:48:14

Công ty khởi nghiệp Rivos gọi vốn 250 triệu USD để phát triển chip AI RISC-V

- Công ty khởi nghiệp Rivos đã huy động được 250 triệu USD trong vòng gọi vốn Series B do quỹ đầu tư mạo hiểm Celesta Capital dẫn đầu.

- Số tiền này sẽ được Rivos sử dụng để phát triển các chip AI dựa trên kiến trúc RISC-V, một kiến trúc chip nguồn mở đang ngày càng phổ biến.

- Rivos đang cạnh tranh với các ông lớn trong ngành như Nvidia, AMD và Intel trong cuộc đua phát triển chip chuyên dụng cho AI.

- Chip AI của Rivos sẽ được sản xuất trên quy trình 3nm tiên tiến của TSMC, dự kiến ra mắt vào năm 2025.

- Rivos cho biết chip của họ sẽ có hiệu năng cao hơn 10 lần so với các chip AI hiện có trên thị trường, đồng thời tiêu thụ ít năng lượng hơn.

- Công ty đang hợp tác với nhiều đối tác trong ngành để phát triển phần mềm và công cụ hỗ trợ cho nền tảng chip RISC-V của mình.

- Rivos được thành lập vào năm 2021, có trụ sở tại Thung lũng Silicon, hiện có khoảng 200 nhân viên.

- Trước đó, Rivos đã huy động được 50 triệu USD trong vòng gọi vốn Series A vào năm 2022.

📌 Rivos, một công ty khởi nghiệp có trụ sở tại Thung lũng Silicon, đã huy động thành công 250 triệu USD để phát triển chip AI dựa trên kiến trúc nguồn mở RISC-V. Với việc sản xuất trên quy trình 3nm của TSMC, chip AI của Rivos hứa hẹn sẽ có hiệu năng vượt trội gấp 10 lần so với các sản phẩm hiện có, đồng thời tiết kiệm năng lượng hơn, tạo ra sự cạnh tranh mạnh mẽ với các ông lớn như Nvidia, AMD và Intel trong cuộc đua chip AI.

Citations:

[1] Startup Rivos raises $250 million to develop RISC-V AI chips https://www.reuters.com/technology/startup-rivos-raises-250-million-develop-risc-v-ai-chips-2024-04-16/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2024-04-17 22:39:20

Ampere sắp tung CPU 256 nhân, liệu có đủ sức cạnh tranh GPU trong suy luận AI?

- Ampere Computing đang chuẩn bị ra mắt CPU AmpereOne-3 với 256 nhân, hứa hẹn mang lại hiệu năng suy luận AI gấp 3-4 lần so với thế hệ trước.

- Tuy nhiên, Nvidia cũng đang thu hẹp khoảng cách với GPU Blackwell B100 mới, cung cấp khả năng xử lý FP4 và hiệu năng suy luận gấp 5 lần.

- Trước đây, CPU Altra 80 nhân của Ampere Computing cho thấy hiệu năng suy luận trên đồng đô la ngang ngửa với GPU T4 của Nvidia, trừ hệ thống nhận dạng giọng nói tự động OpenAI Whisper.

- Khi GPT-4 ra mắt, việc suy luận yêu cầu 8-16 GPU để đạt thời gian phản hồi dưới 200 mili giây, hiện nay con số này là khoảng 32 GPU.

- Intel và IBM cũng đang bổ sung các đơn vị tính toán ma trận vào các bộ xử lý Xeon 5 (trước đây là Xeon SP) và Power10 tương ứng.

- Mặc dù xu hướng sử dụng GPU cho suy luận AI đang gia tăng, CPU vẫn đóng vai trò quan trọng trong các trung tâm dữ liệu doanh nghiệp chạy các mô hình AI quy mô vừa phải với hàng chục đến hàng trăm tỷ tham số.

📌 Ampere Computing đang chuẩn bị tung ra CPU 256 nhân AmpereOne-3, hứa hẹn cạnh tranh mạnh mẽ với GPU trong lĩnh vực suy luận AI. Tuy nhiên, Nvidia cũng đang thu hẹp khoảng cách với GPU Blackwell B100 mới, cung cấp hiệu năng suy luận gấp 5 lần. Mặc dù xu hướng sử dụng GPU ngày càng tăng, CPU vẫn giữ vai trò quan trọng trong các trung tâm dữ liệu doanh nghiệp với các mô hình AI quy mô vừa phải.

Citations:

[1] Ampere Readies 256-Core CPU Beast, Awaits The AI Inference Wave https://www.nextplatform.com/2024/04/16/ampere-readies-256-core-cpu-beast-awaits-the-ai-inference-wave/

Không có file đính kèm.

Nguồn tham khảo

112

AI chips-hardware-compute 2024-04-13 07:04:42

Tại sao dường như mọi công ty AI đều đang tự sản xuất chip riêng?

- Các công ty công nghệ lớn đang đua nhau phát triển chip tùy chỉnh để tăng cường hiệu quả và cắt giảm chi phí cho trí tuệ nhân tạo (AI).

- Meta ra mắt thế hệ chip máy tính tùy chỉnh mới nhất để nâng cao khả năng AI và giảm sự phụ thuộc vào các nhà cung cấp bên ngoài như Nvidia.

- Intel cũng tiết lộ một "bộ tăng tốc" AI cải tiến, trong khi Google cũng đang chuyển sang phát triển chip AI nội bộ.

- Các chuyên gia cho rằng chip AI có thể thúc đẩy các ứng dụng thương mại, giảm chi phí đào tạo mô hình AI cho từng khách hàng, từng tác vụ.

- Chip tùy chỉnh cũng có thể giảm chi phí tích hợp AI sinh thái vào doanh nghiệp.

- Chip tùy chỉnh của Meta hỗ trợ các thuật toán xếp hạng và đề xuất quảng cáo trên Facebook và Instagram, cải thiện cá nhân hóa, giảm độ trễ phản hồi.

- Các nhà sản xuất PC như Apple cũng bắt đầu sử dụng chip chuyên dụng cho AI trong sản phẩm của họ.

📌 Các công ty công nghệ lớn như Meta, Intel, Google đang đua nhau phát triển chip AI tùy chỉnh để tăng hiệu năng, giảm chi phí, nâng cao quyền riêng tư và kiểm soát dữ liệu. Chip AI hứa hẹn thúc đẩy các ứng dụng thương mại, cải thiện trải nghiệm người dùng và giảm rào cản trong việc đào tạo mô hình AI chuyên biệt.

Citations:

[1] Why It Seems Like Every AI Company is Making Their Own Chip https://www.pymnts.com/artificial-intelligence-2/2024/why-it-seems-like-every-ai-company-is-making-their-own-chip/

Không có file đính kèm.

Nguồn tham khảo

113

AI chips-hardware-compute 2024-04-12 23:50:12

Mỹ thiếu mảnh ghép then chốt trong bức tranh chip AI bất chấp khoản đầu tư 65 tỷ USD của TSMC

- TSMC công bố kế hoạch đầu tư 65 tỷ USD để xây dựng nhà máy sản xuất chip AI tại Arizona, Mỹ.

- Tuy nhiên, Mỹ vẫn thiếu các yếu tố quan trọng khác trong chuỗi cung ứng chip AI như thiết kế chip và phần mềm.

- Các công ty Mỹ như Nvidia, AMD đang dẫn đầu về thiết kế chip AI, nhưng phụ thuộc vào TSMC để sản xuất.

- Trung Quốc đang đẩy mạnh phát triển chip AI nội địa với sự hỗ trợ của chính phủ và có thể vượt Mỹ trong tương lai gần.

- Mỹ cần đầu tư nhiều hơn vào nghiên cứu, phát triển phần cứng và phần mềm AI để giữ vị thế dẫn đầu.

- Luật CHIPS của Mỹ nhằm thúc đẩy sản xuất chip trong nước, nhưng chưa đủ để bắt kịp Trung Quốc.

- Cuộc đua chip AI giữa Mỹ và Trung Quốc đang diễn ra gay cấn, kết quả sẽ định hình bức tranh công nghệ toàn cầu trong thập kỷ tới.

📌 Mỹ đang tụt lại phía sau Trung Quốc trong cuộc đua chip AI bất chấp khoản đầu tư 65 tỷ USD của TSMC. Mỹ cần nỗ lực hơn nữa trong nghiên cứu, thiết kế chip và phát triển phần mềm AI để giữ vị thế dẫn đầu trước sự bứt phá của Trung Quốc.

Citations:

[1] US missing pieces of AI chip puzzle despite TSMC's $65bn bet https://www.ft.com/content/10eadba6-f58d-4f88-8ac9-b5180550b7fc

Không có file đính kèm.

Nguồn tham khảo

122

AI chips-hardware-compute 2024-04-12 00:55:09

Nvidia H100 khan hiếm dần được giải tỏa, thời gian giao hàng giảm mạnh từ 4 tháng xuống còn 8-12 tuần

- Theo Digitimes, Tổng giám đốc Dell Đài Loan Terence Liao cho biết thời gian giao hàng của GPU AI Nvidia H100 đã giảm từ 3-4 tháng xuống còn 2-3 tháng (8-12 tuần) trong vài tháng qua.

- Các ODM máy chủ tiết lộ nguồn cung cuối cùng cũng dễ thở hơn so với năm 2023 khi gần như không thể có được GPU H100 của Nvidia.

- Mặc dù thời gian giao hàng giảm, Liao cho biết nhu cầu về phần cứng AI vẫn cực kỳ cao. Cụ thể, việc mua máy chủ AI đang thay thế cho việc mua máy chủ đa năng trong các doanh nghiệp, mặc dù máy chủ AI cực kỳ đắt đỏ.

- Thời gian giao hàng 2-3 tháng là thời gian ngắn nhất từng thấy đối với GPU H100 của Nvidia. Chỉ 6 tháng trước, thời gian chờ đợi lên tới 11 tháng.

- Kể từ đầu năm 2024, thời gian giao hàng đã giảm đáng kể. Đầu năm giảm xuống còn 3-4 tháng, và hiện tại đã giảm thêm 1 tháng nữa. Nếu tốc độ này tiếp tục, thời gian chờ đợi có thể biến mất hoàn toàn vào cuối năm nay hoặc sớm hơn.

- Hành vi này có thể là kết quả của việc một số công ty dư thừa GPU H100 và bán lại một phần nguồn cung để bù đắp chi phí bảo trì cao của hàng tồn kho không sử dụng.

- AWS cũng đã tạo điều kiện thuê GPU Nvidia H100 qua đám mây, giúp giảm bớt một phần nhu cầu H100.

- Các công ty lớn như OpenAI đang phát triển LLM của riêng mình vẫn đang gặp khó khăn về nguồn cung. Họ cần hàng chục nghìn và hàng trăm nghìn GPU để đào tạo LLM nhanh chóng và hiệu quả.

- Tin tốt là điều này sẽ không còn là vấn đề lâu. Nếu thời gian giao hàng tiếp tục rút ngắn theo cấp số nhân như 4 tháng qua, các khách hàng lớn nhất của Nvidia sẽ sớm được đáp ứng.

📌 Thời gian giao hàng GPU Nvidia H100 đã giảm mạnh từ 3-4 tháng xuống 2-3 tháng trong vài tháng qua. Mặc dù nguồn cung đã cải thiện, nhu cầu phần cứng AI vẫn cực kỳ cao, buộc các công ty ưu tiên mua máy chủ AI đắt đỏ. Nếu xu hướng này tiếp diễn, thời gian chờ đợi có thể biến mất hoàn toàn vào cuối năm nay, giúp các khách hàng lớn nhất của Nvidia như OpenAI không còn gặp khó khăn về nguồn cung GPU.

Citations:

[1] Nvidia's H100 AI GPU shortages ease as lead times drop from up to four months to 8-12 weeks https://www.tomshardware.com/pc-components/gpus/nvidias-h100-ai-gpu-shortages-ease-as-lead-times-drop-from-up-to-four-months-to-8-12-weeks

Không có file đính kèm.

Nguồn tham khảo

Semi-Cloud-DC-Green AI chips-hardware-compute 2024-04-12 00:43:00

Cuộc đua giành ưu thế về AI ở Trung Đông qua các trung tâm dữ liệu

- Tại một công viên công nghiệp ở ngoại ô Dubai, một tòa nhà không có dấu hiệu nhận biết đang là nơi diễn ra cuộc cạnh tranh gay gắt về AI giữa các quốc gia vùng Vịnh.

- Cơ sở này có diện tích 23,648 feet vuông, không có cửa sổ, nhiệt độ mát mẻ và vô cùng sạch sẽ. Ngay lối vào, khách phải đi qua tấm thảm dính màu xanh để ngăn cát xâm nhập và làm hỏng thiết bị trị giá hàng triệu đô la bên trong.

- Tòa nhà được xây dựng trong 18 tháng và đi vào hoạt động từ tháng 9. Đây là cơ sở thứ tư của Equinix Inc. tại UAE. Công ty phát triển trung tâm dữ liệu có trụ sở tại California này cũng đang cân nhắc mở rộng sang Ả Rập Xê Út.

- Các quốc gia vùng Vịnh đang chạy đua xây dựng các trung tâm dữ liệu hiện đại bậc nhất thế giới để giành lợi thế trong cuộc đua phát triển AI.

- UAE và Ả Rập Xê Út là hai quốc gia đi đầu trong cuộc cạnh tranh này với việc thu hút các công ty công nghệ lớn đầu tư vào cơ sở hạ tầng trung tâm dữ liệu.

📌 Cuộc đua giành ưu thế về AI đang diễn ra quyết liệt ở Trung Đông, đặc biệt giữa UAE và Ả Rập Xê Út, thông qua việc xây dựng các trung tâm dữ liệu hiện đại với sự tham gia của các công ty công nghệ lớn như Equinix Inc. Cơ sở mới nhất rộng 23.648 feet vuông tại Dubai cho thấy tham vọng dẫn đầu của UAE trong lĩnh vực này.

Citations:

[1] Race for AI Supremacy in Middle East Is Measured in Data Centers https://www.bloomberg.com/news/articles/2024-04-11/race-for-ai-supremacy-in-middle-east-is-measured-in-data-centers

Không có file đính kèm.

Nguồn tham khảo

126

AI chips-hardware-compute 2024-04-11 17:38:54

Intel: CPU vẫn đủ khả năng xử lý nhiều mô hình AI có số lượng tham số dưới 30 tỷ

- Christoph Schell, giám đốc thương mại Intel, cho rằng CPU vẫn có thể xử lý tốt các mô hình AI có số lượng tham số dưới 30 tỷ.
- Sử dụng CPU cho AI giúp tiết kiệm đáng kể chi phí và năng lượng so với GPU hay chip AI chuyên dụng như Nvidia H100 (giá lên tới 40.000 USD).
- Intel đã huấn luyện mô hình AI cho BCG trên CPU vì dữ liệu 50 năm của BCG chỉ tương đương dưới 20 tỷ tham số.
- Đối tác tích hợp hệ thống của Intel tại Ấn Độ cho biết ngưỡng tham số phù hợp cho các mô hình AI ở nước này là từ 7-14 tỷ. Một mô hình ngôn ngữ lớn cho tiếng Hindi có thể cần hơn 30 tỷ tham số.
- Nhiều dữ liệu được lưu trữ tại trung tâm dữ liệu doanh nghiệp và máy tính cá nhân. Việc huấn luyện và suy luận AI trên những dữ liệu này hoàn toàn có thể thực hiện trên CPU.
- Ví dụ như tóm tắt cuộc gọi hội nghị ngay khi kết thúc trên Zoom có thể được xử lý bởi AI chạy trên CPU.

📌 CPU vẫn đóng vai trò quan trọng trong nhiều ứng dụng AI có số lượng tham số dưới 30 tỷ, giúp tiết kiệm chi phí và năng lượng đáng kể so với GPU hay chip AI chuyên dụng. Nhiều dữ liệu doanh nghiệp và cá nhân có thể được xử lý bởi mô hình AI chạy trên CPU.

Citations:
[1] https://timesofindia.indiatimes.com/technology/tech-news/why-cpus-are-sufficient-for-many-ai-models/articleshow/109201642.cms

Không có file đính kèm.

Nguồn tham khảo

143

AI chips-hardware-compute 2024-04-10 23:34:19

Chip AI thế hệ mới của Meta tăng tốc huấn luyện mô hình gấp 3 lần

- Meta giới thiệu thế hệ chip AI mới MTIA với hiệu năng vượt trội, giúp đào tạo các mô hình xếp hạng và đề xuất nhanh hơn.
- Chip MTIA mới có 256MB bộ nhớ tích hợp với xung nhịp 1.3GHz, so với 128MB và 800GHz của phiên bản v1.
- Kết quả thử nghiệm sớm cho thấy chip mới hoạt động nhanh hơn 3 lần so với thế hệ trước trên 4 mô hình được Meta đánh giá.
- MTIA là một phần quan trọng trong kế hoạch dài hạn của Meta nhằm xây dựng cơ sở hạ tầng cho việc sử dụng AI trong các dịch vụ của mình.
- Meta muốn thiết kế chip phù hợp với cơ sở hạ tầng công nghệ hiện tại và các tiến bộ tương lai trong GPU.
- Mục tiêu cuối cùng của MTIA là mở rộng khả năng để bắt đầu huấn luyện các mô hình AI tạo sinh như mô hình ngôn ngữ Llama.
- Nhu cầu về chip mạnh mẽ để chạy các mô hình AI đang tăng cao, thúc đẩy các công ty phát triển chip riêng.
- Google, Microsoft và Amazon cũng đã giới thiệu các chip AI mới để đáp ứng nhu cầu tính toán ngày càng tăng.
- Nvidia hiện đang thống trị thị trường chip AI với mức định giá lên tới 2 nghìn tỷ đô la.

📌 Meta đang đẩy mạnh phát triển chip AI tùy chỉnh như MTIA nhằm tăng tốc huấn luyện mô hình lên 3 lần, với mục tiêu mở rộng sang các mô hình AI tạo sinh. Cuộc đua phát triển chip AI đang nóng lên giữa các ông lớn công nghệ nhằm đáp ứng nhu cầu tính toán ngày càng cao cho các ứng dụng trí tuệ nhân tạo.

https://www.theverge.com/2024/4/10/24125924/meta-mtia-ai-chips-algorithm-training

Không có file đính kèm.

Nguồn tham khảo

195

AI chips-hardware-compute 2024-04-10 10:02:32

Intel tuyên bố chip AI mới vượt trội hơn Nvidia, quyết tâm trở thành nhà sản xuất hệ thống AI số 2 thế giới

- Intel ra mắt chip AI Gaudi 3, có hiệu năng và hiệu quả cao hơn trong huấn luyện các mô hình AI tạo sinh so với các sản phẩm cạnh tranh, kể cả chip H100 đắt tiền của Nvidia.
- Gaudi 3 có sức mạnh tính toán AI, băng thông mạng và bộ nhớ vượt trội so với thế hệ trước, giúp mở rộng quy mô huấn luyện và suy luận trên các mô hình ngôn ngữ lớn (LLM) và mô hình AI đa phương thức.
- Chip mới của Intel được dự đoán nhanh hơn 50% khi huấn luyện các LLM hàng đầu so với chip H100 của Nvidia, và nhanh hơn 30% khi suy luận so với chip H200.
- Gaudi 3 cải thiện dung lượng bộ nhớ, giúp giảm số lượng chip cần thiết để xử lý dữ liệu từ các mô hình AI lớn hơn, nâng cao hiệu quả chi phí cho các trung tâm dữ liệu.
- Intel nhận được 8.5 tỷ USD tài trợ trực tiếp từ Đạo luật CHIPS và Khoa học, nằm trong kế hoạch 100 tỷ USD mở rộng sản xuất chip tại Mỹ trong 5 năm tới.
- CEO Pat Gelsinger khẳng định Intel cam kết trở thành nhà sản xuất hệ thống AI số 2 thế giới vào cuối thập kỷ này.
- Gaudi 3 sẽ có sẵn cho các nhà sản xuất thiết bị trong quý 2 năm nay và dự kiến sẽ được sử dụng rộng rãi hơn vào cuối năm.
- Intel tự tin khẳng định Gaudi 3 vượt trội hơn hẳn chip H100 của Nvidia về hiệu năng và tổng chi phí sở hữu (TCO).

📌 Intel giới thiệu chip AI Gaudi 3 mới với hiệu năng vượt trội, dự đoán nhanh hơn 50% so với chip H100 của Nvidia khi huấn luyện các mô hình ngôn ngữ lớn. Công ty cam kết trở thành nhà sản xuất hệ thống AI số 2 thế giới vào cuối thập kỷ, nhận được 8,5 tỷ USD tài trợ từ chính phủ Mỹ để mở rộng sản xuất chip. Intel tự tin khẳng định Gaudi 3 vượt trội hơn đối thủ Nvidia về mọi mặt.

https://qz.com/intel-ai-hardware-gaudi-3-accelerator-nvidia-1851391888

Không có file đính kèm.

Nguồn tham khảo

144

AI chips-hardware-compute 2024-04-10 09:49:23

Google tung chip AI và CPU mới, thách thức Nvidia, Microsoft và Amazon

- Google ra mắt chip AI mới TPU v5p, có thể huấn luyện các mô hình ngôn ngữ lớn nhanh gấp 3 lần so với thế hệ trước TPU v4.
- TPU v5p là đối thủ cạnh tranh với chip AI phổ biến của Nvidia. Google cũng đang sử dụng chip mới nhất của Nvidia, Blackwell, trong siêu máy tính AI Hypercomputer.
- Google Cloud CEO Thomas Kurian giới thiệu CPU Google Axion dựa trên kiến trúc Arm, cạnh tranh với CPU của Microsoft và Amazon.
- Google Axion có hiệu năng cao hơn 30% so với các chip Arm phổ biến nhất hiện nay trên cloud và tiết kiệm năng lượng hơn 60%.
- Khách hàng sử dụng Arm ở bất kỳ đâu đều có thể dễ dàng chuyển sang Axion mà không cần thay đổi kiến trúc hoặc viết lại ứng dụng.
- Việc Google phát triển phần cứng AI mới đưa công ty lên vị trí tiên phong trong cuộc chuyển đổi nền tảng AI.

📌 Google giới thiệu chip AI TPU v5p mới, huấn luyện mô hình ngôn ngữ lớn nhanh gấp 3 lần thế hệ trước, cùng CPU Arm Google Axion hiệu năng vượt trội 30-60%, đánh dấu cột mốc quan trọng trong cuộc đua AI với Nvidia, Microsoft và Amazon.

https://qz.com/google-ai-chip-nvidia-axion-arm-microsoft-1851397201

Không có file đính kèm.

Nguồn tham khảo

127

AI chips-hardware-compute 2024-04-09 23:45:31

Google tung chip Axion mới, đẩy mạnh nỗ lực sản xuất phần cứng AI nội bộ

- Google ra mắt chip Axion mới, tiếp tục nỗ lực hơn 1 thập kỷ phát triển tài nguyên điện toán mới, bắt đầu từ các chip chuyên dụng cho AI.
- Chip Axion có thể xử lý nhiều tác vụ từ tìm kiếm, quảng cáo YouTube đến phân tích dữ liệu lớn, giúp Google giảm phụ thuộc vào các nhà cung cấp bên ngoài.
- Google hợp tác chặt chẽ với Broadcom từ 2016 để sản xuất phần cứng theo yêu cầu. Doanh thu của Broadcom tăng vọt sau khi Google tăng sản xuất TPU gần đây.
- Chi tiêu vốn của Alphabet tăng gần 50% lên 11 tỷ USD trong quý 4/2022 so với cùng kỳ năm trước, chủ yếu cho cơ sở hạ tầng kỹ thuật như chip AI.
- Google cho thuê chip tùy chỉnh cho khách hàng đám mây thay vì bán trực tiếp. Chip Axion sẽ có sẵn cho khách hàng bên ngoài vào cuối năm nay.
- Vào tháng 11/2022, Google nối thành công hơn 50.000 TPU để xây dựng hệ thống AI lớn nhất từ trước đến nay.
- Nỗ lực sản xuất chip nội bộ của Google bắt đầu từ đột phá công nghệ nhận dạng giọng nói năm 2013.
- Chip Axion mới cải thiện hiệu suất lên đến 30% so với các chip tương tự nhanh nhất hiện có trên đám mây.

📌 Google đang đẩy mạnh đầu tư vào sản xuất chip nội bộ như Axion và TPU để giảm phụ thuộc vào các đối tác lâu năm như Intel, Nvidia. Chip Axion mới cải thiện hiệu suất lên đến 30% so với các chip tương tự nhanh nhất hiện có trên đám mây. Điều này hứa hẹn giúp Google tiết kiệm chi phí và tăng khả năng cạnh tranh trong cuộc đua AI, dù vẫn phải đối mặt với sự ganh đua gay gắt từ Amazon và Microsoft.

Citations:
[1] https://www.wsj.com/tech/google-expands-in-house-chip-efforts-in-costly-ai-battle-3121c852

#WSJ

Không có file đính kèm.

Nguồn tham khảo

103

AI chips-hardware-compute 2024-04-09 23:37:39

Năng lượng tính toán - Loại "dầu: mới - Nguồn tài nguyên quý giá nhất trong kỷ nguyên AI tạo sinh

- Năng lượng tính toán được coi là "dầu mỏ mới" và sẽ trở thành hàng hóa quý giá nhất trong tương lai do nhu cầu của AI tạo sinh.
- OpenAI và Microsoft lên kế hoạch xây dựng trung tâm dữ liệu Stargate trị giá 100 tỷ đô la, dự kiến hoàn thành vào năm 2028 với công suất lên tới 5 gigawatt.
- Sam Altman, CEO của OpenAI, đầu tư 375 triệu đô la vào Helion Energy để phát triển năng lượng nhiệt hạch. Microsoft cũng đồng ý mua điện từ nhà máy điện nhiệt hạch đầu tiên của Helion.
- Altman cũng đầu tư vào Oklo, một startup phát triển ứng dụng thương mại cho phản ứng phân hạch hạt nhân quy mô nhỏ.
- Các mô hình AI như GPT-5 và Sora của OpenAI đòi hỏi năng lượng tính toán khổng lồ, thúc đẩy nhu cầu phát triển tài nguyên năng lượng và trung tâm dữ liệu riêng.
- Amazon đầu tư gần 150 tỷ đô la vào trung tâm dữ liệu trong 15 năm tới để đáp ứng nhu cầu ứng dụng AI.
- Elon Musk cho rằng năng lượng tính toán AI tăng gấp 10 lần sau mỗi 6 tháng và hầu hết các trung tâm dữ liệu đang chuyển đổi từ tính toán thông thường sang tính toán AI.
- Altman đang tìm cách thành lập một liên doanh sản xuất chip AI và tìm kiếm sự chấp thuận từ chính phủ Mỹ. OpenAI cũng đang tìm các lựa chọn thay thế cho GPU của NVIDIA.

📌 Năng lượng tính toán đóng vai trò then chốt trong kỷ nguyên AI tạo sinh. OpenAI và Microsoft đang đầu tư 100 tỷ đô la vào trung tâm dữ liệu Stargate với công suất lên tới 5 gigawatt. Sam Altman cũng đầu tư vào các công ty năng lượng như Helion và Oklo để đáp ứng nhu cầu năng lượng khổng lồ của các mô hình AI mới. Bên cạnh đó, Altman còn tìm cách thành lập liên doanh sản xuất chip AI để giảm sự phụ thuộc vào NVIDIA.

https://analyticsindiamag.com/compute-is-the-new-oil/

Không có file đính kèm.

Nguồn tham khảo

124

AI chips-hardware-compute 2024-04-09 23:15:34

AMD tung ra chip Versal thế hệ 2, mang AI tới biên mạng nhanh hơn bao giờ hết

- AMD giới thiệu dòng chip Versal AI Edge Gen 2 và Versal Prime Gen 2, đánh dấu bước tiến trong tăng tốc AI cho hệ thống nhúng.
- Các thiết bị Gen 2 mới có công suất TOPs trên mỗi watt cao gấp 3 lần và khả năng tính toán vô hướng cao gấp 10 lần so với thế hệ đầu tiên.
- Subaru Corporation là một trong những khách hàng đầu tiên tuyên bố kế hoạch triển khai chip Versal AI Edge Gen 2 cho hệ thống hỗ trợ lái xe tiên tiến EyeSight thế hệ tiếp theo.
- Versal AI Edge Gen 2 tích hợp các bộ xử lý phù hợp cho các giai đoạn tiền xử lý, suy luận AI và hậu xử lý, mang đến giải pháp toàn diện trên một chip duy nhất.
- Versal Prime Gen 2 phục vụ các hệ thống nhúng truyền thống không dựa trên AI, kết hợp logic lập trình với CPU Arm hiệu suất cao, phù hợp cho các ứng dụng như streaming video UHD, PC công nghiệp và máy tính bay.
- AMD cung cấp các công cụ như Vivado Design Suite và Vitis Unified Software Platform để đẩy nhanh quá trình phát triển và rút ngắn thời gian đưa sản phẩm ra thị trường.
- Tài liệu truy cập sớm và bộ đánh giá cho các thiết bị Versal Gen 2 đã có sẵn, với mẫu silicon dự kiến trong nửa đầu năm 2025 và silicon sản xuất vào cuối năm 2025.

📌 AMD đã giới thiệu chip Versal thế hệ 2 với hiệu suất vượt trội, tiêu thụ điện năng thấp và khả năng mở rộng linh hoạt. Subaru đã chọn chip Versal AI Edge Gen 2 cho hệ thống hỗ trợ lái xe tiên tiến EyeSight, thể hiện sự tin tưởng vào khả năng mang lại hiệu suất AI, độ trễ cực thấp và an toàn chức năng của chip này.

https://venturebeat.com/ai/amd-launches-second-generation-versal-chips-to-make-ai-faster-at-the-edge/

Không có file đính kèm.

Nguồn tham khảo

101

Semi-Cloud-DC-Green AI chips-hardware-compute 2024-04-09 13:55:32

Hàn Quốc đầu tư 7 tỷ USD vào AI để giữ vững vị thế về chip

• Tổng thống Hàn Quốc Yoon Suk Yeol tuyên bố đầu tư 9.4 nghìn tỷ won (6.94 tỷ USD) vào trí tuệ nhân tạo đến năm 2027.
• Mục tiêu nhằm duy trì vị thế dẫn đầu toàn cầu về chip bán dẫn tiên tiến.
• Thành lập quỹ riêng trị giá 1.4 nghìn tỷ won để thúc đẩy các công ty chip AI.
• Hàn Quốc nỗ lực bắt kịp các nước như Mỹ, Trung Quốc, Nhật Bản trong việc hỗ trợ chính sách mạnh mẽ để tăng cường chuỗi cung ứng chip bán dẫn.
• Chip bán dẫn là nền tảng then chốt của nền kinh tế xuất khẩu Hàn Quốc. Xuất khẩu chip đạt 11.7 tỷ USD vào tháng 3/2024, mức cao nhất trong 21 tháng.
• Hàn Quốc sẽ mở rộng đáng kể nghiên cứu và phát triển chip AI như NPU và chip bộ nhớ băng thông cao thế hệ tiếp theo.
• Thúc đẩy phát triển AGI thế hệ tiếp theo và công nghệ an toàn vượt ra ngoài các mô hình hiện có.
• Mục tiêu đến năm 2030, Hàn Quốc trở thành 1 trong 3 nước hàng đầu về công nghệ AI và chiếm 10% thị phần chip hệ thống toàn cầu.
• Tổng thống Yoon nhấn mạnh tác động của trận động đất gần đây ở Đài Loan đối với các công ty Hàn Quốc là hạn chế, nhưng yêu cầu chuẩn bị kỹ lưỡng trước các bất ổn.

📌 Hàn Quốc đầu tư mạnh 9,4 nghìn tỷ won (7 tỷ USD) vào AI đến 2027, thành lập quỹ 1,4 nghìn tỷ won cho chip AI, nhằm giữ vững vị thế dẫn đầu về chip bán dẫn, đặt mục tiêu top 3 công nghệ AI và 10% thị phần chip hệ thống toàn cầu năm 2030.

https://www.aol.com/news/south-korea-invest-7-billion-053358078.html

Không có file đính kèm.

Nguồn tham khảo

124

AI chips-hardware-compute 2024-04-08 23:46:45

Triển vọng ngành bán dẫn 2024: Kỷ nguyên của chip AI tạo sinh

- Doanh số chip AI tạo sinh dự kiến đạt 50 tỷ USD vào năm 2024, chiếm 8.5% tổng doanh số ngành bán dẫn. Tuy nhiên, số lượng chip AI tạo sinh chỉ chiếm dưới 0.1% tổng số chip bán ra do giá thành cao (40,000 USD/chip).
- Chip AI tạo sinh bao gồm GPU, CPU, HBM3 đặc biệt được đóng gói tiên tiến 2.5D cùng các chip kết nối. Nhu cầu chip AI tạo sinh chủ yếu đến từ các công ty phần mềm doanh nghiệp.
- AI tạo sinh đang cải tiến toàn bộ chuỗi giá trị bán dẫn: lập lịch và dự báo sản xuất, thúc đẩy R&D, phát hiện khuyết tật, tối ưu sản xuất, tiếp thị mục tiêu. Tuy nhiên, chi phí xây dựng mô hình AI tạo sinh tùy chỉnh cao và cần xác thực của con người.
- Nhà máy bán dẫn đang ứng dụng AI tạo sinh để phân tích dữ liệu lớn, tối ưu quy trình, giảm tác động môi trường.
- Mỹ và Châu Âu cần phát triển năng lực back-end (lắp ráp và kiểm tra chip) song song với đầu tư front-end (sản xuất chip) để tránh phức tạp chuỗi cung ứng.
- Ngành bán dẫn đối mặt với mối đe dọa an ninh mạng đặc thù do sở hữu tài sản trí tuệ có giá trị cao. Các cuộc tấn công tinh vi ngụy trang thành ransomware tạo ra thách thức bất đối xứng.
- Tại Thái Lan, nhập khẩu mạch tích hợp tăng 2% và bán dẫn tăng 23% trong năm 2023. Thái Lan đang thu hút đầu tư từ Mỹ vào sản xuất chip để thúc đẩy tham vọng trở thành trung tâm hạ tầng và xe điện. Dự kiến sẽ có nhà máy sản xuất wafer (linh kiện chip) đầu tư tại Thái Lan.

📌 Ngành bán dẫn toàn cầu đang chứng kiến sự bùng nổ của chip AI tạo sinh với doanh số ước tính 50 tỷ USD vào năm 2024. AI tạo sinh không chỉ được ứng dụng trong xử lý mà còn cải tiến toàn bộ chuỗi giá trị bán dẫn. Tuy nhiên, ngành này cũng đối mặt với thách thức an ninh mạng đặc thù. Tại Thái Lan, nhập khẩu chip tăng mạnh trong năm 2023 và nước này đang nỗ lực thu hút đầu tư từ Mỹ để phát triển ngành bán dẫn.

https://www2.deloitte.com/th/en/pages/about-deloitte/articles/2024-semiconductor-outlook-en.html

Không có file đính kèm.

Nguồn tham khảo

128

AI chips-hardware-compute 2024-04-08 07:53:27

AMD tuyên bố chip xử lý của họ xử lý các mô hình ngôn ngữ lớn (LLM) nhanh hơn 79% so với chip của Intel

- AMD tuyên bố chip xử lý của họ xử lý các mô hình ngôn ngữ lớn (LLM) nhanh hơn 79% so với chip của Intel sau khi thực hiện một số bài kiểm tra.
- Chip Ryzen mobile 7040 Phoenix và Ryzen mobile 8040 series của AMD hoạt động tốt hơn chip Core Ultra Meteor Lake của Intel, đôi khi lên đến 79%.
- AMD chứng minh ý nghĩa của điều này với người tiêu dùng bằng cách trình diễn hai máy tính xách tay có giá tương đương, nhưng một chiếc sử dụng chip Intel và chiếc kia sử dụng chip AMD có hiệu năng tốt hơn.
- Để chip hoạt động tốt nhất, các công ty và nhà phát triển cần tạo ra và sử dụng các dịch vụ hỗ trợ chip.
- Phần mềm chuyên biệt có thể tương tác tốt hơn với phần cứng và xử lý LLM hiệu quả hơn.
- Microsoft thông báo DirectML sẽ hỗ trợ NPU chỉ dành cho chip Intel, cho phép các nhà phát triển tương tác tốt hơn với NPU của Intel trong khi AMD bị bỏ lại phía sau.
- Công nghệ xử lý AI còn mới và các công ty công nghệ khác đang phát triển các giải pháp của riêng họ để cạnh tranh với Nvidia, một tên tuổi lớn khác trong lĩnh vực xử lý AI.
- AMD cần duy trì sức nóng nếu muốn dẫn đầu Intel và các đối thủ cạnh tranh mới.

📌 AMD tuyên bố chip xử lý LLM nhanh hơn Intel 79% nhờ chip Ryzen mobile 7040 và 8040. Tuy nhiên, phần mềm chuyên biệt là yếu tố then chốt để tối ưu hóa hiệu năng. Cuộc đua phần cứng AI đang nóng lên với sự tham gia của nhiều công ty công nghệ, buộc AMD phải luôn dẫn đầu để giữ vị trí.

https://www.xda-developers.com/amd-chips-process-llms-79-faster-intel/

Không có file đính kèm.

Nguồn tham khảo

129

AI tools AI chips-hardware-compute 2024-04-07 16:48:04

Microsoft nâng cấp Azure AI Search, đột phá y tế với Nvidia DGX Cloud

- Microsoft nâng cấp Azure AI Search, tăng dung lượng lưu trữ và vector lên 11 lần, tổng dung lượng tăng 6 lần, cải thiện gấp đôi thông lượng indexing và truy vấn.
- Hệ thống RAG của Azure AI Search giờ tương thích với ChatGPT, GPT và API Assistant của OpenAI. Microsoft sẽ là nguồn năng lượng mỗi khi ai đó chạy truy vấn hoặc thêm tệp vào các sản phẩm AI này.
- Microsoft tích hợp chip Nvidia GB200 Grace Blackwell Superchip và mạng Nvidia Quantum-X800 InfiniBand vào Azure, cùng với dòng máy ảo Azure NC H100 v5 VM.
- Sự hợp tác mở rộng giữa Microsoft Azure và Nvidia DGX Cloud cùng bộ microservice Nvidia Clara mang lại khả năng đẩy nhanh đổi mới trong nghiên cứu lâm sàng, khám phá thuốc và chăm sóc bệnh nhân.
- API Nvidia Omniverse Cloud sẽ có mặt trên Microsoft Azure, mở rộng tầm với của nền tảng Omniverse.
- Copilot cho Microsoft 365 sẽ sớm có phím vật lý trên PC Windows 11, kết hợp sức mạnh của các mô hình ngôn ngữ lớn với dữ liệu doanh nghiệp để cung cấp trí tuệ thời gian thực theo ngữ cảnh.
- Tích hợp sâu hơn giữa Nvidia DGX Cloud với Microsoft Fabric giúp các runtime, LLM và machine learning được tối ưu hóa của Nvidia hoạt động liền mạch với Microsoft Fabric.

📌 Microsoft đã nâng cấp đáng kể Azure AI Search với dung lượng lưu trữ tăng 11 lần, hỗ trợ các ứng dụng RAG lớn của OpenAI. Việc tích hợp sâu hơn với Nvidia DGX Cloud và chip GB200 mới nhất mang lại nhiều đột phá trong y tế, khoa học sự sống. Copilot sẽ có phím vật lý riêng trên Windows 11, cung cấp trí tuệ thời gian thực theo ngữ cảnh.

Citations:
[1] https://venturebeat.com/ai/microsoft-boosts-azure-ai-search-with-more-storage-and-support-for-big-rag-apps/

Không có file đính kèm.

Nguồn tham khảo

131

AI chips-hardware-compute 2024-04-05 16:58:46

CoreWeave: Nhu cầu trung tâm dữ liệu cho AI bị đánh giá thấp nghiêm trọng, chuỗi cung ứng gặp thách thức lớn

- Brian Venturo, đồng sáng lập và giám đốc chiến lược của CoreWeave, cho rằng thế giới đang đánh giá thấp "một cách thô thiển" mức độ mở rộng thị trường trung tâm dữ liệu toàn cầu do nhu cầu về AI trong 5 năm tới.
- CoreWeave nhận được những yêu cầu "vô lý" về trung tâm dữ liệu hàng ngày, với nhiều khách hàng muốn có cả một khu tổ hợp riêng cho mình.
- Thị trường đang di chuyển nhanh hơn nhiều so với khả năng của chuỗi cung ứng vốn hỗ trợ cho một ngành công nghiệp vật lý.
- Venturo dự đoán sẽ xuất hiện nhiều "siêu khu tổ hợp" gây áp lực lên lưới điện và dẫn đến những cuộc tranh cãi chính trị.
- Ngành công nghiệp sẽ phải vượt qua một số thách thức trong quá trình này.
- Sự bùng nổ của AI tạo sinh đang thúc đẩy cuộc đua về trung tâm dữ liệu, biến CoreWeave trở thành một trong những startup công nghệ "nóng" nhất.
- Nvidia dự kiến sẽ có 250 tỷ USD chi tiêu hàng năm cho thiết bị trung tâm dữ liệu.
- Amazon dự định chi gần 150 tỷ USD trong 15 năm tới để xây dựng trung tâm dữ liệu nhằm đáp ứng nhu cầu tăng vọt từ các công cụ AI.
- Venturo lo ngại về việc thiết lập cơ sở hạ tầng để xử lý nhu cầu, gọi đó là một cuộc chạy nước rút đòi hỏi tất cả nguồn vốn trên thế giới.
- Việc cải tạo các trung tâm dữ liệu cũ rất khó khăn do cơ sở hạ tầng cung cấp điện hiện tại không hỗ trợ được việc mở rộng, đòi hỏi phải xây dựng đường dây truyền tải và trạm biến áp mới.
- Các "siêu máy tính" như Amazon, Google và Microsoft cũng đang đối mặt với những thách thức tương tự.

📌 Nhu cầu về trung tâm dữ liệu cho AI đang tăng vọt nhanh hơn nhiều so với khả năng đáp ứng của chuỗi cung ứng. CoreWeave dự báo sẽ xuất hiện nhiều siêu khu tổ hợp trung tâm dữ liệu, gây áp lực lên cơ sở hạ tầng và nguồn điện. Ngành công nghiệp đang phải đối mặt với thách thức lớn trong việc mở rộng quy mô để theo kịp tốc độ phát triển chóng mặt của AI.

https://www.bloomberg.com/news/articles/2024-04-04/ai-demand-for-data-centers-vastly-underestimated-coreweave-says

Không có file đính kèm.

Nguồn tham khảo

117

AI chips-hardware-compute 2024-04-04 22:50:26

AI factory là trung tâm dữ liệu chuyên biệt được tối ưu hóa cho AI,

- AI factory là trung tâm dữ liệu chuyên biệt đáp ứng các yêu cầu cụ thể của AI, cung cấp cơ sở hạ tầng và tài nguyên để triển khai các ứng dụng và mô hình AI phức tạp.
- Mục đích của AI factory tương tự như trung tâm dữ liệu và nhà máy vật lý. Chúng sản xuất trí tuệ nhân tạo, có thể được sử dụng để vận hành các mô hình AI, tài sản và hệ thống CNTT.
- AI factory xử lý một lượng lớn dữ liệu để tạo ra trí tuệ và cập nhật các hệ thống, hoặc tạo ra các nội dung như văn bản, hình ảnh, video, âm thanh.
- Các trung tâm này có phần cứng và phần mềm cần thiết để triển khai AI tạo sinh vào hoạt động CNTT, cải thiện hiệu quả, khả năng mở rộng và đổi mới.
- AI factory đòi hỏi nhiều năng lượng, giải pháp làm mát hơn trung tâm dữ liệu truyền thống. Chúng được thiết kế với phần cứng chuyên dụng như chip AI và GPU.
- Foxconn và Nvidia hợp tác xây dựng các AI factory sử dụng chip Nvidia trên toàn thế giới để xử lý dữ liệu và tạo ra các sản phẩm tiên tiến như xe tự lái.
- Nvidia giới thiệu chip Blackwell GB200 mới nhất để cung cấp năng lượng cho "cuộc cách mạng công nghiệp mới" này.
- EU đưa ra các biện pháp hỗ trợ các dự án AI factory, cho phép các startup tiếp cận siêu máy tính chuyên dụng AI để xây dựng mô hình riêng.

📌 AI factory đang nổi lên như một hệ sinh thái mới, với cơ sở hạ tầng và tài nguyên chuyên biệt để triển khai các ứng dụng AI quy mô lớn. Được dẫn dắt bởi các công ty như Nvidia và Foxconn, AI factory hứa hẹn mang lại một cuộc cách mạng công nghiệp mới trong sản xuất trí tuệ nhân tạo, tạo ra các sản phẩm tiên tiến và thúc đẩy đổi mới trên nhiều lĩnh vực.

https://techmonitor.ai/technology/ai-and-automation/what-is-an-ai-factory

Không có file đính kèm.

Nguồn tham khảo

157

AI chips-hardware-compute AI startup-M&A 2024-04-03 00:04:56

Hailo gây sốc khi huy động 120 triệu đô la, sẵn sàng đối đầu với Nvidia trong cuộc đua chip AI

- Hailo, một công ty khởi nghiệp về chip AI, đã huy động được 120 triệu đô la từ các nhà đầu tư như Alfred Akirov, Delek Motors và OurCrowd.
- Công ty có hơn 300 khách hàng trong các ngành như ô tô, an ninh, bán lẻ, tự động hóa công nghiệp, thiết bị y tế và quốc phòng.
- Chip của Hailo thực hiện các tác vụ AI với mức sử dụng bộ nhớ và tiêu thụ điện năng thấp hơn, phù hợp cho các thiết bị nhỏ gọn, ngoại tuyến và chạy bằng pin.
- Giáo sư Christos Kozyrakis tin rằng chip tăng tốc như của Hailo sẽ trở nên "hoàn toàn cần thiết" khi AI phát triển rộng rãi.
- Thách thức đối với Hailo là tính bền vững nếu kiến trúc mô hình AI mà chip của họ được thiết kế để chạy hiệu quả không còn phổ biến và hỗ trợ phần mềm nếu không đủ nhà phát triển sẵn sàng học cách sử dụng công cụ xây dựng xung quanh chip của Hailo.
- Hailo có 340 triệu đô la trong ngân hàng và khoảng 250 nhân viên.
- Công nghệ của Hailo giải quyết nhiều thách thức mà các công ty gặp phải với suy luận AI dựa trên đám mây, đặc biệt là độ trễ, chi phí và khả năng mở rộng.
- Trí tuệ nhân tạo tạo sinh đang thúc đẩy nhu cầu mới đối với phần cứng của Hailo, với các yêu cầu xử lý LLM cục bộ từ khách hàng trong các ngành điện toán, ô tô, tự động hóa công nghiệp, an ninh và nhiều ngành khác.

📌 Hailo đã huy động thành công 120 triệu đô la, nâng tổng vốn lên 340 triệu đô la với 300 khách hàng trải rộng nhiều ngành. Chip AI tiết kiệm năng lượng của họ đang đáp ứng nhu cầu ngày càng tăng về ứng dụng AI biên và xử lý LLM cục bộ. Tuy nhiên, Hailo vẫn phải đối mặt với thách thức từ các đối thủ lớn như Nvidia trong hệ sinh thái phần mềm.

https://techcrunch.com/2024/04/02/hailo-ai-chip-startup-lands-120m-to-battle-nvidia/

Không có file đính kèm.

Nguồn tham khảo

169

AI chips-hardware-compute Semi-Cloud-DC-Green 2024-04-02 23:36:22

NVIDIA biến trung tâm dữ liệu thành "nhà máy AI" cho AI tạo sinh

- NVIDIA đang gây bất ngờ cho thế giới với tốc độ chóng mặt. Elon Musk cho rằng tính toán AI đang tăng trưởng theo cấp số nhân, tăng gấp 10 lần sau mỗi 6 tháng.
- Tại GTC 2024, CEO Jensen Huang so sánh các trung tâm dữ liệu với các nhà máy trong cuộc cách mạng công nghiệp. Các trung tâm dữ liệu giờ đây sản xuất "token dữ liệu" bằng cách sử dụng dữ liệu và điện năng như nguyên liệu thô.
- NVIDIA hợp tác với Foxconn để xây dựng "nhà máy AI" sử dụng chip NVIDIA cho xe tự lái, robot và huấn luyện mô hình ngôn ngữ lớn.
- Các nhà cung cấp cloud lớn như AWS, Microsoft Azure, Google Cloud và Oracle Cloud đều có kế hoạch cung cấp GPU và hệ thống Blackwell mới của NVIDIA trong trung tâm dữ liệu của họ.
- Tuy nhiên, cuộc cách mạng AI do Blackwell thúc đẩy cũng đối mặt với nhiều thách thức như nhu cầu tính toán tăng vọt, áp lực nâng cao hiệu quả năng lượng và đáp ứng mục tiêu năng lượng tái tạo.
- Elon Musk cho biết ràng buộc chính hiện nay là tính sẵn có của năng lượng điện do nhu cầu năng lượng đáng kể của AI.
- Microsoft và OpenAI công bố dự án siêu máy tính AI Stargate trị giá hơn 115 tỷ USD, dự kiến ra mắt năm 2028. AWS cũng có kế hoạch đầu tư hơn 150 tỷ USD vào trung tâm dữ liệu trong 15 năm tới.

📌Elon Musk cho rằng tính toán AI đang tăng trưởng theo cấp số nhân, tăng gấp 10 lần sau mỗi 6 tháng. Jensen Huang so sánh các trung tâm dữ liệu với các nhà máy trong cuộc cách mạng công nghiệp. NVIDIA đang dẫn đầu xu hướng biến trung tâm dữ liệu thành "nhà máy AI" để đáp ứng nhu cầu tính toán khổng lồ cho AI tạo sinh. Tuy nhiên, điều này cũng đặt ra nhiều thách thức về hiệu quả năng lượng và nguồn cung điện.

https://analyticsindiamag.com/how-nvidia-is-turning-data-centers-into-ai-factories-for-generative-ai/

Không có file đính kèm.

Nguồn tham khảo

158

Semi-Cloud-DC-Green AI chips-hardware-compute 2024-04-02 23:22:44

Kiến trúc đám mây không chỉ có GPU trong hệ thống AI tạo sinh

- GPU đóng vai trò quan trọng trong việc thúc đẩy sự phát triển của AI, nhưng quá nhấn mạnh có thể làm lu mờ việc tìm kiếm và tận dụng các giải pháp thay thế hiệu quả và bền vững hơn.
- Doanh thu trung tâm dữ liệu của Nvidia đạt 14,5 tỷ USD trong quý gần nhất, tăng 41% so với quý trước và 279% so với cùng kỳ năm ngoái. GPU của họ hiện là tiêu chuẩn trong xử lý AI.
- GPU yêu cầu một chip chủ để điều phối hoạt động, điều này làm giảm hiệu quả. Việc giao tiếp giữa các quá trình, tách rời và tái tập hợp mô hình cũng gây ra những thách thức về hiệu quả.
- Các thư viện và framework phần mềm như CUDA của Nvidia cung cấp mô hình lập trình và bộ công cụ cần thiết để phát triển phần mềm tận dụng khả năng tăng tốc GPU.
- Trong 2 năm tới, sự phấn khích về GPU sẽ qua đi. Thay vào đó, trọng tâm sẽ là hiệu quả suy luận, cải tiến mô hình liên tục và các cách mới để quản lý thuật toán và dữ liệu.
- Các đối thủ cạnh tranh tiềm năng của Nvidia hiện nay là AMD, Intel và một số startup như SambaNova, Cerebras, GraphCore, Groq và xAI.
- Nhiều kiến trúc AI tạo sinh sử dụng CPU truyền thống mà không ảnh hưởng đáng kể đến hiệu suất. Tùy thuộc vào mục đích, hầu hết triển khai AI tạo sinh trong doanh nghiệp sẽ cần ít năng lượng hơn.

📌 GPU đóng vai trò quan trọng trong AI tạo sinh, nhưng không nên là trọng tâm duy nhất. Trong 2 năm tới, sự phấn khích về GPU sẽ qua đi. Thay vào đó, trọng tâm sẽ là hiệu quả suy luận, cải tiến mô hình liên tục và các cách mới để quản lý thuật toán và dữ liệu. Nhiều giải pháp thay thế GPU hiệu quả, tiết kiệm năng lượng đang xuất hiện từ các đối thủ của Nvidia.

https://www.infoworld.com/article/3714629/theres-more-to-cloud-architecture-than-gpus.html

Không có file đính kèm.

Nguồn tham khảo

118

AI chips-hardware-compute 2024-04-02 23:10:17

Mỹ hạn chế khả năng tiếp cận chip Nvidia của Trung Quốc, Việt Nam chịu ảnh hưởng

- Mỹ áp đặt yêu cầu cấp phép bổ sung đối với việc xuất khẩu chip Nvidia sang một số quốc gia, bao gồm cả Việt Nam, nhằm hạn chế hơn nữa khả năng tiếp cận của Trung Quốc với các công nghệ quan trọng.
- Động thái này được đưa ra sau quy định "Thực hiện các biện pháp kiểm soát xuất khẩu bổ sung: Một số mặt hàng máy tính tiên tiến và sản xuất bán dẫn; Siêu máy tính và sử dụng cuối cùng bán dẫn; Sửa đổi danh sách thực thể" của Cục Công nghiệp và An ninh, trực thuộc Bộ Thương mại Hoa Kỳ.
- Quy định này áp dụng kiểm soát đối với các mạch tích hợp máy tính tiên tiến (IC), hàng hóa máy tính chứa các IC đó và một số mặt hàng sản xuất bán dẫn, có hiệu lực từ ngày 17/11/2023 đến ngày 01/01/2026.
- Các sản phẩm bị ảnh hưởng của Nvidia bao gồm các mạch tích hợp vượt quá ngưỡng hiệu suất nhất định, bao gồm nhưng không giới hạn ở dòng A100, A800, H100, H800, L40, L40S và card đồ họa gaming RTX 4090.
- Bất kỳ hệ thống nào kết hợp một hoặc nhiều mạch tích hợp được đề cập (bao gồm nhưng không giới hạn ở hệ thống NVIDIA DGX và HGX) cũng đều thuộc phạm vi áp dụng của các quy tắc mới.
- Các yêu cầu cấp phép bổ sung áp dụng cho Trung Quốc và các nhóm quốc gia D1, D4 và D5, nhưng không bao gồm Israel. Việt Nam thuộc nhóm quốc gia D1 và D3.
- Yêu cầu cấp phép có thể ảnh hưởng đến khả năng của Nvidia trong việc hoàn thành phát triển sản phẩm kịp thời, hỗ trợ khách hàng hiện tại của các sản phẩm liên quan hoặc cung cấp cho khách hàng các sản phẩm liên quan bên ngoài các khu vực bị ảnh hưởng, đồng thời có thể yêu cầu Nvidia chuyển một số hoạt động ra khỏi một hoặc nhiều quốc gia được xác định.

📌 Mỹ áp đặt yêu cầu cấp phép bổ sung đối với xuất khẩu chip Nvidia sang Trung Quốc, Việt Nam và một số quốc gia khác từ 17/11/2023 đến 01/01/2026, ảnh hưởng đến các dòng sản phẩm vượt ngưỡng hiệu suất nhất định. Động thái này có thể gây khó khăn cho Nvidia trong việc phát triển và cung cấp sản phẩm đúng hạn cho khách hàng.

https://theinvestor.vn/us-restricts-chinas-access-to-some-nvidia-chips-vietnam-consequently-impacted-d7077.html

- D1 và D3 là các nhóm quốc gia được Bộ Thương mại Mỹ (BIS) phân loại trong Quy định Quản lý Xuất khẩu (EAR). Các quốc gia được chia thành 4 nhóm chính: A, B, D và E.

- Nhóm D gồm các quốc gia bị hạn chế và ít được hưởng ngoại lệ cấp phép xuất khẩu hơn. Nhóm D được chia thành 5 nhóm nhỏ dựa trên các mối quan ngại khác nhau:
+ D1: An ninh quốc gia
+ D2: Hạt nhân
+ D3: Hóa học & Sinh học
+ D4: Công nghệ tên lửa
+ D5: Các quốc gia bị Mỹ cấm vận vũ khí

- Một số quốc gia thuộc nhóm D1 và D3 bao gồm: Afghanistan, Armenia, Azerbaijan, Belarus, Campuchia, Trung Quốc, Georgia, Iraq, Kazakhstan, Bắc Triều Tiên, Kyrgyzstan, Lào, Moldova, Mông Cổ, Nga, Syria, Tajikistan, Việt Nam, Yemen...

- Việc một quốc gia thuộc nhóm D1 hay D3 liên quan đến các hạn chế và yêu cầu cấp phép xuất khẩu chặt chẽ hơn của Mỹ đối với hàng hóa, công nghệ nhạy cảm liên quan đến an ninh quốc gia, vũ khí hóa học/sinh học.

Như vậy, D1 và D3 phản ánh đánh giá và chính sách kiểm soát xuất khẩu của Mỹ với từng quốc gia dựa trên các tiêu chí về an ninh và công nghệ nhạy cảm. Việc nằm trong các nhóm này đồng nghĩa với việc chịu sự giám sát chặt chẽ hơn từ phía Mỹ.

Citations:

https://www.bis.doc.gov/index.php/documents/regulations-docs/2255-supplement-no-1-to-part-740-country-groups-1

Không có file đính kèm.

Nguồn tham khảo

142

AI chips-hardware-compute 2024-04-02 22:57:46

3 card đồ họa Nvidia đừng dại mua lúc này nếu không muốn tiền mất tật mang

- RTX 4060 Ti có dung lượng VRAM thấp so với tầm giá, bus bộ nhớ hẹp chỉ 128-bit, ít nhân CUDA hơn thế hệ trước. Hiệu năng chỉ hơn RTX 4060 khoảng 20% nhưng giá cao hơn tới 100 USD. Thậm chí phiên bản 16GB cũng không đáng giá do bị giới hạn bởi bus bộ nhớ. Với sự hỗ trợ của DLSS 3, RTX 4060 là lựa chọn hợp lý hơn.

- RTX 3090 tuy là card đồ họa thế hệ trước nhưng giá vẫn rất đắt, từ 1.370 USD trở lên cho hàng mới. Trong khi đó, RTX 4070 chỉ với giá 525 USD có thể đạt hiệu năng tương đương. RTX 4070 Super 580 USD thậm chí còn vượt trội hơn. Với DLSS 3, RTX 4070 Super có thể đạt tới 165 fps ở độ phân giải 1440p ultra trong Cyberpunk 2077.

- RTX 4080 là card đồ họa có giá trị kém nhất thế hệ Ada do định giá quá cao so với hiệu năng, chậm hơn RTX 4090 30% nhưng giá lên tới 1.200 USD. Nvidia đã nhận ra sai lầm và ra mắt RTX 4080 Super với giá 1.000 USD. Tuy nhiên trên thực tế, cả 2 phiên bản đều khó tìm được với giá đề xuất. Với sự cạnh tranh gay gắt từ AMD và các mẫu như RTX 4070 Ti Super, RTX 4080 trở nên kém hấp dẫn.

📌 Tùy vào nhu cầu và ngân sách, người dùng có thể lựa chọn các card đồ họa phù hợp như RTX 4060, RX 7700 XT, RX 7800 XT, RTX 4070 Super để thay thế cho RTX 4060 Ti; RTX 4070, 4070 Super, RX 7900 GRE, RX 7800 XT cho RTX 3090; hay RX 7900 XTX, RTX 4070 Ti, thậm chí RTX 4090 để thay cho RTX 4080. Giá cả và hiệu năng luôn là yếu tố then chốt cần cân nhắc kỹ trước khi quyết định mua card đồ họa mới.

Citations:
[1] https://www.digitaltrends.com/computing/3-nvidia-gpus-to-avoid/

Không có file đính kèm.

Nguồn tham khảo

118

AI chips-hardware-compute 2024-04-02 11:15:16

Cuộc chiến công nghệ: hạn chế xuất khẩu bán dẫn mới của Mỹ làm tăng nhu cầu về card đồ họa Nvidia RTX 4090 tại Trung Quốc

- Các hạn chế xuất khẩu bán dẫn mới nhất của Mỹ đối với Trung Quốc đã biến card đồ họa trở thành một trong những mặt hàng được săn đón nhất ở Huaqiangbei, khu chợ bán buôn đồ điện tử lớn nhất thế giới.
- Nhu cầu về card đồ họa cao cấp, đặc biệt là Nvidia GeForce RTX 4090, vẫn rất mạnh mẽ sau khi Mỹ áp đặt các hạn chế xuất khẩu.
- Các thương nhân ở Huaqiangbei đang tích trữ nhiều loại hàng hóa liên quan đến AI và chờ đợi bán với giá cao.
- Giá của một số phiên bản RTX 4090 hiện khoảng 20.000 nhân dân tệ (2.768 USD), cao hơn 70% so với giá bán lẻ đề xuất của Nvidia.
- Tại Trung Quốc, RTX 4090 cũng được sử dụng để hỗ trợ các chức năng nhận thức trên xe tự lái.
- Chính quyền Biden đã sửa đổi các biện pháp kiểm soát xuất khẩu, khiến Trung Quốc khó tiếp cận hơn với bộ xử lý AI tiên tiến, thiết bị sản xuất chip và thậm chí cả laptop được trang bị các chip đó.
- Trung Quốc phản đối các hạn chế sửa đổi, cho rằng chúng gây trở ngại cho hợp tác kinh tế thương mại bình thường giữa các công ty Trung Quốc và Mỹ.

📌 Các hạn chế xuất khẩu bán dẫn mới nhất của Mỹ đã làm tăng đột biến nhu cầu về card đồ họa Nvidia RTX 4090 tại Trung Quốc, với giá tăng hơn 70% so với mức đề xuất. Bắc Kinh phản đối các biện pháp này, cho rằng chúng gây tổn hại đến hợp tác kinh tế song phương và ngành công nghiệp bán dẫn toàn cầu.

https://www.scmp.com/tech/tech-war/article/3257484/tech-war-updated-us-semiconductor-export-restrictions-raise-demand-china-nvidias-rtx-4090-graphics

Không có file đính kèm.

Nguồn tham khảo

112

AI chips-hardware-compute 2024-04-01 23:56:48

Sharon Zhou, nhà sáng lập AI đang làm tốt mà không cần chip của Nvidia

- Sharon Zhou, 30 tuổi, là CEO và đồng sáng lập Lamini AI. Cô ấy có nền tảng giáo dục ấn tượng từ Harvard và Stanford.
- Lamini AI cung cấp nền tảng giúp doanh nghiệp dễ dàng đào tạo và tạo ra các mô hình ngôn ngữ lớn (LLM) tùy chỉnh chỉ với vài dòng mã.
- Khác với xu hướng chung, Lamini AI chỉ sử dụng GPU của AMD thay vì Nvidia để xây dựng nền tảng.
- Quyết định này dựa trên hiểu biết của đồng sáng lập Greg Diamos, cựu kiến trúc sư phần mềm tại Nvidia, rằng phần mềm cũng quan trọng như phần cứng GPU.
- AMD đang xây dựng hệ sinh thái phần mềm tương tự như CUDA của Nvidia xung quanh GPU của họ.
- Lamini AI muốn đáp ứng nhu cầu tăng vọt về LLM của doanh nghiệp mà không phụ thuộc vào nguồn cung hạn chế của Nvidia.
- Lamini AI đã triển khai thành công chip MI300X mới của AMD vào sản xuất.

📌 Sharon Zhou và Lamini AI đang thách thức sự thống trị của Nvidia trong lĩnh vực AI bằng cách sử dụng GPU của AMD để xây dựng nền tảng giúp doanh nghiệp dễ dàng tạo ra các mô hình ngôn ngữ lớn tùy chỉnh. Với hiệu suất cao và nguồn cung ổn định từ AMD, Lamini AI đang sẵn sàng đáp ứng nhu cầu ngày càng tăng về LLM.

https://www.businessinsider.com/nvidia-chips-lamini-ai-amd-jensen-huang-sharon-zhou-2024-4

Không có file đính kèm.

Nguồn tham khảo

173

AI chips-hardware-compute 2024-04-01 04:08:55

Trung Quốc cần tập trung thúc đẩy ngành AI nội địa để thu hẹp khoảng cách với Mỹ

- Các công ty AI Trung Quốc cần tập trung phát triển phần cứng và phần mềm nội địa để bắt kịp với các đối thủ hàng đầu của Mỹ trong lĩnh vực AI tạo sinh.
- Liu Cong, Phó Chủ tịch công ty AI Trung Quốc iFlytek, thừa nhận rằng ngành công nghiệp Trung Quốc vẫn còn khoảng cách với các đối thủ hàng đầu thế giới về AI tạo sinh.
- Zeng Yi, giáo sư Viện Hàn lâm Khoa học Trung Quốc, cho rằng các công ty Trung Quốc không chỉ nên tập trung vào các bước đột phá trong mô hình ngôn ngữ lớn (LLM), mà còn phải phát triển phần cứng và phần mềm mới.
- Lệnh cấm xuất khẩu chip bán dẫn của Mỹ là một trong những rào cản chính đối với sự phát triển AI tạo sinh của Trung Quốc.
- Trung Quốc và Mỹ đang cạnh tranh gay gắt để thống trị lĩnh vực AI, và Trung Quốc được cho là đang dẫn đầu trong các lĩnh vực như nhận dạng khuôn mặt và lái xe tự động.
- Tuy nhiên, sự ra mắt của ChatGPT vào tháng 11/2022 đã thay đổi cuộc chơi AI tạo sinh, và các công ty Trung Quốc đang cố gắng thu hẹp khoảng cách với các đối thủ trong nước như Ernie Bot 4 của Baidu và iFlytek Spark 3.0.
- Yuan Hui, người sáng lập và CEO của công ty AI Chatbot Xiao-I, cho rằng Trung Quốc cần tập trung phát triển công nghệ "cốt lõi và nền tảng".
- Ngoài lệnh cấm chip của Mỹ, Trung Quốc còn phải đối mặt với những thách thức trong nước như chi phí tính toán khổng lồ và kiểm duyệt.

📌 Trung Quốc được cho là đang dẫn đầu trong các lĩnh vực như nhận dạng khuôn mặt và lái xe tự động. Sự ra mắt của ChatGPT vào tháng 11/2022 đã thay đổi cuộc chơi AI tạo sinh, và các công ty Trung Quốc đang cố gắng thu hẹp khoảng cách với các đối thủ trong nước như Ernie Bot 4 của Baidu và iFlytek Spark 3.0. T. Các lãnh đạo ngành công nghiệp kêu gọi tập trung phát triển phần cứng và phần mềm nội địa, đồng thời vượt qua các rào cản như lệnh cấm xuất khẩu chip của Mỹ, chi phí tính toán cao và kiểm duyệt trong nước.

https://www.scmp.com/news/china/diplomacy/article/3257370/china-needs-focus-boosting-domestic-ai-sector-close-gap-us-export-curbs-chips-take-their-toll

Không có file đính kèm.

Nguồn tham khảo

102

AI chips-hardware-compute 2024-03-31 00:22:50

Công ty Trung Quốc Intellifusion ra mắt chip AI 14nm DeepEdge với giá chỉ 140 USD, rẻ hơn 90% so với GPU

- Công ty Trung Quốc Intellifusion giới thiệu dòng sản phẩm AI box "DeepEyes" với chip AI DeepEdge 14nm, giá khoảng 140 USD, rẻ hơn 90% so với GPU.

- Chip DeepEdge10Max đạt hiệu năng 48 TOPS cho tác vụ huấn luyện AI ở định dạng int8. Các phiên bản DeepEdge10Pro và DeepEdge10Ultra trong tương lai hướng tới hiệu năng 24-96 TOPS.

- Chip DeepEdge sử dụng công nghệ nội địa độc lập của Trung Quốc như CPU RISC 1.8 GHz, GPU 800 MHz và NPU chuyên dụng NNP400T.

- Hiệu năng 40 TOPS là yêu cầu tối thiểu cho một "PC AI" theo Microsoft. Hầu hết các NPU hiện tại chỉ đạt tốc độ 16 TOPS.

- Chủ tịch Intellifusion cho rằng 80% công ty trên thế giới sẽ sử dụng các mô hình AI lớn trong 3 năm tới, nhưng chi phí huấn luyện và triển khai rất đắt đỏ. Chip DeepEdge giúp giảm chi phí đáng kể.

- Việc sử dụng công nghệ nội địa và node 14nm cũ hơn giúp Trung Quốc né các lệnh trừng phạt của Mỹ và duy trì sức cạnh tranh trên thị trường AI.

📌 Intellifusion của Trung Quốc ra mắt chip AI 14nm DeepEdge với giá chỉ 140 USD, rẻ hơn GPU tới 90%, hướng tới hiệu năng 24-96 TOPS. Sử dụng công nghệ nội địa và node cũ giúp né lệnh trừng phạt Mỹ, giảm chi phí triển khai AI cho doanh nghiệp.

https://www.tomshardware.com/tech-industry/artificial-intelligence/chinese-chipmaker-launches-14nm-ai-processor-thats-90-cheaper-than-gpus

Không có file đính kèm.

Nguồn tham khảo

105

AI chips-hardware-compute 2024-03-29 22:37:57

HKEPC ép xung RTX 4090D lên ngang tầm 4090 bất chấp lệnh trừng phạt

- HKEPC, một trang công nghệ và đánh giá PC tại Hồng Kông, đã ép xung thành công card đồ họa Asus ROG Strix GeForce RTX 4090D tuân thủ lệnh trừng phạt của Mỹ, nâng hiệu năng lên ngang tầm với RTX 4090 tiêu chuẩn.

- RTX 4090D là phiên bản cắt giảm của RTX 4090, được thiết kế để vượt qua các hạn chế hiệu năng do chính phủ Mỹ đặt ra nhằm ngăn Trung Quốc tiếp cận chip tiên tiến có thể tăng cường sức mạnh quân sự.

- RTX 4090D có 114 SM so với 128 SM trên 4090, dẫn đến giảm số lượng nhân Tensor, CUDA và RT. Tổng công suất xử lý (TPP) của 4090D là 4.707, dưới mức giới hạn 4.800 do lệnh trừng phạt áp đặt.

- HKEPC nhận thấy Asus ROG Strix RTX 4090D có thể được ép xung, nâng giới hạn công suất lên tối đa 600W bằng phần mềm GPU Tweak III. Kết quả là hiệu năng tăng 8,7-9,3%, đạt mức tương đương RTX 4090.

- HKEPC kết luận rằng dù Nvidia không cho phép bán card OC, họ không hạn chế người dùng tự ép xung. RTX 4090D sau khi ép xung có thể đạt hiệu năng ngang RTX 4090 FE.

📌 Trang công nghệ HKEPC đã chứng minh việc ép xung có thể giúp RTX 4090D đạt hiệu năng ngang ngửa 4090 tiêu chuẩn, bất chấp các hạn chế từ lệnh trừng phạt của Mỹ đối với Trung Quốc. Điều này gây lo ngại rằng các biện pháp kiểm soát xuất khẩu chip tiên tiến có thể bị vô hiệu hóa bởi người dùng.

https://www.tomshardware.com/pc-components/gpus/nvidias-sanctions-compliant-4090d-gaming-gpu-for-china-is-overclockable-restoring-performance-to-standard-unsanctioned-rtx-4090-fe-levels

Không có file đính kèm.

Nguồn tham khảo

110

AI chips-hardware-compute 2024-03-29 22:32:40

Hoa Kỳ và Mexico hợp tác trong chuỗi cung ứng chip AI

- Hoa Kỳ hợp tác với Mexico để tìm kiếm cơ hội mở rộng và đa dạng hóa sản xuất chip, nhằm tạo ra chuỗi cung ứng bán dẫn toàn cầu bền vững và an toàn hơn.
- Sự hợp tác này được tài trợ bởi quỹ ITSI (International Technology Security and Innovation), một phần của đạo luật CHIPS and Science Act được chính quyền Biden thông qua năm 2022.
- Trong giai đoạn đầu, Mexico sẽ đánh giá hệ sinh thái bán dẫn hiện có, khung pháp lý, lực lượng lao động và nhu cầu cơ sở hạ tầng. Các chính quyền bang, học giả, nhà nghiên cứu và doanh nghiệp Mexico sẽ hợp tác với Bộ Kinh tế Mexico trong quá trình đánh giá.
- Đánh giá này sẽ giúp hai quốc gia xác định các sáng kiến chung tiềm năng trong tương lai.
- Hoa Kỳ và Mexico là đối tác quan trọng trong việc đảm bảo chuỗi cung ứng bán dẫn toàn cầu đáp ứng quá trình chuyển đổi số đang diễn ra trên toàn thế giới.
- Sự hợp tác này nhấn mạnh tiềm năng đáng kể trong việc mở rộng ngành công nghiệp bán dẫn của Mexico, mang lại lợi ích cho cả hai quốc gia.
- Đây là sự hợp tác quốc tế đầu tiên trong khuôn khổ Đạo luật CHIPS, song Hoa Kỳ đã đầu tư hàng tỷ đô la vào sản xuất bán dẫn cho các công ty công nghệ Mỹ.
- Intel, nhà sản xuất chip, đã nhận được khoản đầu tư 8.5 tỷ USD và công bố kế hoạch đầu tư hơn 100 tỷ USD trong 5 năm tới để mở rộng sản xuất bán dẫn tại Mỹ với các cơ sở ở Arizona, New Mexico, Ohio và Oregon.
- Intel muốn xây dựng "cơ sở sản xuất chip AI lớn nhất thế giới" gần Columbus, Ohio. Hiện tại, Hoa Kỳ chỉ sản xuất dưới 10% chip trên toàn cầu.

📌 Hoa Kỳ và Mexico hợp tác chiến lược trong lĩnh vực sản xuất chip AI, với Mexico đánh giá hệ sinh thái bán dẫn hiện có để tìm kiếm cơ hội mở rộng. Sự hợp tác này, được tài trợ bởi quỹ ITSI trị giá 8,5 tỷ USD, hứa hẹn tạo ra chuỗi cung ứng chip bền vững và an toàn hơn, đồng thời thúc đẩy ngành công nghiệp bán dẫn của cả hai quốc gia. Trong khi đó, gã khổng lồ Intel cũng công bố kế hoạch đầu tư hơn 100 tỷ USD để mở rộng sản xuất chip tại Mỹ.

https://qz.com/us-mexico-partnering-semiconductor-supply-chain-1851373873

Không có file đính kèm.

Nguồn tham khảo

135

Semi-Cloud-DC-Green AI chips-hardware-compute 2024-03-28 23:12:28

Amazon đổ 150 tỷ USD vào trung tâm dữ liệu để chuẩn bị cho cuộc cách mạng AI

• Amazon dự kiến chi gần 150 tỷ USD trong 15 năm tới để xây dựng trung tâm dữ liệu nhằm đáp ứng nhu cầu dịch vụ AI tạo sinh và điện toán đám mây.
• Khoản đầu tư khổng lồ này nhằm giữ vững vị trí dẫn đầu của AWS trong lĩnh vực điện toán đám mây so với Microsoft và Google.
• AWS đang mở rộng tại Virginia, Oregon và các khu vực mới như Mississippi, Saudi Arabia và Malaysia.
• Nhu cầu điện năng cho trung tâm dữ liệu đang gây áp lực lên các công ty điện lực tại Virginia và Oregon.
• Amazon đang tìm kiếm các nguồn năng lượng mới như điện hạt nhân, pin lưu trữ để giảm phát thải carbon.
• Các dự án năng lượng tái tạo của Amazon thường cách xa trung tâm dữ liệu do hạn chế của lưới điện.
• Người dân một số khu vực phản đối xây dựng trung tâm dữ liệu do tiếng ồn và tác động môi trường.

📌 Amazon dự kiến chi gần 150 tỷ USD trong 15 năm tới để xây dựng trung tâm dữ liệu nhằm đáp ứng nhu cầu dịch vụ AI tạo sinh và điện toán đám mây. 150 tỷ USD đầu tư khổng lồ, mở rộng tại nhiều bang, tìm kiếm năng lượng mới nhưng vẫn gặp phản đối về môi trường.

Citations:
[1] https://www.bloomberg.com/news/articles/2024-03-28/amazon-bets-150-billion-on-data-centers-required-for-ai-boom

Không có file đính kèm.

Nguồn tham khảo

122

AI chips-hardware-compute 2024-03-28 17:25:42

Startup Anh quốc huy động 10 triệu bảng để tạo "siêu não" AI huấn luyện LLM nhanh gấp 100 lần

- Oriole Networks, một công ty khởi nghiệp từ UCL, đã huy động được 10 triệu bảng Anh trong vòng gọi vốn hạt giống để xây dựng "siêu não" AI.
- Công nghệ mới này hứa hẹn tăng tốc độ huấn luyện các mô hình ngôn ngữ lớn (LLM) lên 100 lần.
- Công ty đã phát triển một phương pháp mới sử dụng ánh sáng để kết nối hàng nghìn chip AI, tạo ra một mạng lưới chip hoạt động như một máy duy nhất.
- James Regan, CEO của Oriole Networks, cho biết điều này cho phép kết nối trực tiếp một số lượng lớn các nút, giúp chúng hoạt động như một máy duy nhất.
- Điểm mới của phương pháp này nằm ở việc triển khai các giao thức truyền dẫn và chuyển mạch tùy chỉnh dựa trên ánh sáng.
- Các giao thức này giúp giảm đáng kể mức tiêu thụ năng lượng cần thiết so với các triển khai mạng quy mô tương đương.
- Siêu não AI này có thể huấn luyện LLM nhanh hơn 100 lần và giảm độ trễ xuống 1/1000, đồng thời cải thiện mức tiêu thụ năng lượng lên 40 lần.
- Công nghệ này không chỉ giải quyết được mối lo ngại về nhu cầu và mức tiêu thụ năng lượng khổng lồ của AI, mà còn tăng tốc các tác vụ quan trọng về thời gian như giao dịch thuật toán.
- Oriole Networks tin rằng công nghệ của họ sẽ mang lại lợi ích đáng kể cho các công ty làm việc với AI và các trung tâm dữ liệu.
- Số tiền huy động sẽ được sử dụng để đưa công nghệ từ mức trình diễn trong phòng thí nghiệm đến các thử nghiệm với khách hàng trong một mạng dữ liệu quang triển khai.

📌 Oriole Networks đã huy động được 10 triệu bảng Anh để phát triển công nghệ "siêu não" AI, hứa hẹn tăng tốc huấn luyện LLM lên 100 lần, giảm tiêu thụ năng lượng 40 lần bằng cách kết nối hàng nghìn chip AI qua ánh sáng, mở ra tiềm năng ứng dụng trong giao dịch thuật toán và trung tâm dữ liệu.

https://thenextweb.com/news/ucl-spinout-bags-10m-ai-super-brains-100x-faster-llm-training

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2024-03-26 17:29:08

ClearML mang đến khả năng chia nhỏ GPU miễn phí, thúc đẩy dân chủ hóa quyền truy cập điện toán AI

- ClearML giới thiệu tính năng chia nhỏ GPU miễn phí cho người dùng nguồn mở, cho phép "chia nhỏ" một GPU duy nhất để chạy đồng thời nhiều tác vụ AI.
- Điều này gợi nhớ lại thời kỳ đầu của điện toán khi các máy tính lớn có thể được chia sẻ giữa các cá nhân và tổ chức mà không cần mua thêm phần cứng.
- Tính năng mới hỗ trợ các GPU Nvidia GTX, RTX và GPU cấp trung tâm dữ liệu hỗ trợ MIG, cho phép người dùng chuyển đổi giữa các công việc R&D nhỏ và các công việc huấn luyện lớn hơn, đòi hỏi nhiều tài nguyên hơn.
- Phương pháp này hỗ trợ đa người thuê, cung cấp khả năng tính toán an toàn và bảo mật với giới hạn bộ nhớ cứng.
- ClearML cho biết các bên liên quan có thể chạy các khối lượng công việc song song độc lập trên một tài nguyên tính toán dùng chung, tăng hiệu quả và giảm chi phí.
- Tính năng chia nhỏ GPU nguồn mở mới hiện có sẵn miễn phí trên trang GitHub của ClearML.

📌 ClearML đã giới thiệu tính năng chia nhỏ GPU miễn phí cho người dùng nguồn mở, hỗ trợ nhiều loại GPU Nvidia hơn bất kỳ công ty nào khác. Điều này thúc đẩy dân chủ hóa quyền truy cập vào tài nguyên tính toán, giúp các tổ chức tận dụng tối đa cơ sở hạ tầng hiện có, tăng hiệu quả và giảm chi phí khi triển khai các khối lượng công việc AI.

https://www.techradar.com/pro/is-the-ai-gpu-the-new-mainframe-new-open-source-tech-allows-users-to-timeshare-gpu-resources-for-ai-purposes-for-free-reminiscent-of-the-days-where-scarce-resources-fosted-computing-elitism

Không có file đính kèm.

Nguồn tham khảo

108

AI chips-hardware-compute 2024-03-25 23:44:43

Sora của OpenAI tạt "gáo nước lạnh" vào giấc mơ AI của Trung Quốc

- Mô hình AI tạo video Sora của OpenAI đã gây chấn động cộng đồng AI Trung Quốc, tương tự như khi ChatGPT ra mắt. Sora có thể tạo video ấn tượng từ lời nhắc văn bản.
- Các công ty Trung Quốc như Zhipu AI hứa hẹn sẽ có sản phẩm tương tự Sora vào cuối năm nay. Nhiều người lạc quan về cơ hội của Trung Quốc nhờ các mô hình AI mã nguồn mở đang bắt kịp nhanh chóng.
- Các startup AI Trung Quốc như AIsphere gọi vốn thành công. ByteDance đang tuyển dụng nhiều nhân tài AI để bắt kịp đối thủ trong nước.
- Đài truyền hình quốc gia Trung Quốc (CMG) và Phòng thí nghiệm AI Thượng Hải (Sail) hợp tác sản xuất series hoạt hình thơ cổ điển Trung Quốc bằng AI. Công nghệ AI được sử dụng từ thiết kế nghệ thuật đến tạo video.
- Tuy nhiên, khoảng cách chất lượng AI giữa Mỹ và Trung Quốc vẫn rõ rệt. Các nhà phát triển Trung Quốc vẫn bị cắt khỏi chip cao cấp dùng để đào tạo mô hình AI.
- Các hạn chế của Mỹ với công nghệ Nvidia ngày càng mở rộng sang phần mềm. Huawei đang nỗ lực phát triển chip Ascend 910B để thay thế.
- Một số công ty fintech Trung Quốc tuyên bố sẽ được ưu tiên truy cập Sora trên nền tảng điện toán đám mây Azure của Microsoft. Tuy nhiên, Mỹ đe dọa ngăn các nền tảng AI phục vụ khách hàng Trung Quốc.
- Lợi ích thương mại của các sản phẩm như Sora là có thật. Sản xuất video tốn nhiều thời gian nên AI giúp đẩy nhanh quá trình này sẽ được hoan nghênh.

📌 Mô hình Sora của OpenAI đã châm ngòi cuộc đua AI tạo video, buộc các công ty công nghệ Trung Quốc phải nỗ lực bắt kịp. Mặc dù bị hạn chế tiếp cận chip cao cấp và đối mặt rào cản từ Mỹ, Trung Quốc vẫn có cơ hội nhờ xu hướng mã nguồn mở. Các ứng dụng thực tế của AI tạo video như tăng tốc sản xuất nội dung đang được các đài truyền hình, studio khai thác.

https://www.scmp.com/economy/global-economy/article/3256557/global-impact-cut-high-end-chips-how-much-us-tech-war-hurting-chinas-ai-ambitions-sora-highlights

Không có file đính kèm.

Nguồn tham khảo

140

AI chips-hardware-compute 2024-03-25 07:30:12

Broadcom trình làng siêu chip AI XPU - có thể là chip lớn nhất thế giới cho công ty AI tiêu dùng

- Broadcom đã trình diễn một con chip có thể là bộ xử lý lớn nhất thế giới, nhưng chưa rõ ứng dụng cụ thể.
- Tại các sự kiện của TSMC, luôn có trưng bày các bộ xử lý multi-chiplet sử dụng công nghệ đóng gói chip-on-wafer-on-substrate (CoWoS), với các chiplet tính toán gần giới hạn kích thước 858mm^2 (26mm x 33mm).
- Một trong những thiết bị đó đến từ Broadcom và đã được trưng bày tại các sự kiện gần đây dành cho nhà đầu tư của công ty.
- Broadcom không chỉ là một gã khổng lồ trong lĩnh vực mạng và viễn thông, mà còn có mảng kinh doanh thiết kế chip tùy chỉnh đáng kể, với Google là một trong những khách hàng nổi bật nhất.
- Broadcom không công bố khách hàng của mình, nhưng họ trình diễn những thành tựu to lớn với các nhà đầu tư, như chip XPU thứ ba được thiết kế cho một "công ty AI tiêu dùng lớn".
- Chip XPU sử dụng bộ nhớ băng thông cao (HBM), cho thấy mục tiêu sử dụng có thể là trí tuệ nhân tạo hoặc chuyển mạch mạng cường độ cao tích hợp AI.
- Chip có 2 khối tính toán ở trung tâm và nhiều khối HBM ở hai bên, là một SoC tùy chỉnh hoàn chỉnh với khả năng tính toán, kết nối tốc độ cao trong chip và hiệu suất mạng bên ngoài cao nhất.
- Việc phát triển một chiplet ở quy mô gần giới hạn kích thước đã là một thành tựu, và đạt năng suất ở mức phù hợp lại là một thành tựu khác của đối tác sản xuất chip (có thể là TSMC) của Broadcom.

📌 Broadcom đã trình diễn chip XPU khổng lồ, có thể là chip lớn nhất thế giới được thiết kế cho một công ty AI tiêu dùng lớn. Chip tùy chỉnh này sử dụng bộ nhớ HBM, nhắm đến ứng dụng AI hoặc chuyển mạch mạng hiệu năng cao. Đây là một thành tựu đáng kể về thiết kế và sản xuất chip của Broadcom cùng đối tác.

https://www.tomshardware.com/tech-industry/artificial-intelligence/broadcom-shows-gargantuan-ai-chip-xpu-could-the-worlds-largest-chip-built-for-a-consumer-ai-company

Không có file đính kèm.

Nguồn tham khảo

130

AI chips-hardware-compute 2024-03-25 07:03:51

Các nhà khoa học Trung Quốc đã tạo ra chip AI tiết kiệm năng lượng nhất thế giới cho thiết bị di động

- Các nhà khoa học Trung Quốc đã giới thiệu 2 chip AI siêu tiết kiệm năng lượng với hiệu suất kỷ lục tại Hội nghị Quốc tế về Mạch tích hợp bán dẫn IEEE (ISSCC) 2024.
- Chip thứ nhất được thiết kế để nhúng vào thiết bị thông minh, cho phép điều khiển bằng giọng nói ngoại tuyến. Chip này vượt trội trong nhận dạng từ khóa và xác minh người nói ngay cả trong môi trường ồn ào.
- Chip đạt mức tiêu thụ năng lượng nhận dạng dưới 2 microjoule/lần, với tỷ lệ chính xác trên 95% trong môi trường yên tĩnh và 90% trong môi trường ồn ào, thiết lập các chuẩn mực toàn cầu mới về hiệu quả năng lượng và độ chính xác.
- Chip thứ hai được thiết kế để phát hiện tín hiệu động kinh ở người bị động kinh, sử dụng nhận dạng điện não đồ (EEG) để cảnh báo cơn động kinh đang diễn ra.
- Chip sử dụng thuật toán tái huấn luyện zero-shot cho phép mô hình AI dự đoán chính xác trên dữ liệu chưa từng thấy mà không cần thu thập tín hiệu động kinh của bệnh nhân, đạt tỷ lệ chính xác trên 98%.
- Mức tiêu thụ năng lượng nhận dạng trung bình của chip chỉ khoảng 0.07 microjoule, là thiết kế tiết kiệm năng lượng nhất trên thế giới.
- Cả hai chip đều có tiềm năng ứng dụng rộng rãi trong các lĩnh vực như nhà thông minh, thiết bị đeo, đồ chơi thông minh, giao diện não-máy tính và theo dõi giấc ngủ.

📌 Các nhà khoa học Trung Quốc đã tạo ra chip AI tiết kiệm năng lượng nhất thế giới cho thiết bị di động, có thể điều khiển bằng giọng nói ngoại tuyến và phát hiện cơn động kinh ở người bệnh động kinh.

https://www.scmp.com/news/china/science/article/3256211/chinese-scientists-create-worlds-most-energy-efficient-ai-chips-mobile-devices

Không có file đính kèm.

Nguồn tham khảo

138

AI chips-hardware-compute 2024-03-23 00:23:44

Schneider Electric và NVIDIA hợp tác lập lộ trình trung tâm dữ liệu AI

- Schneider Electric đang hợp tác với NVIDIA để tối ưu hóa cơ sở hạ tầng trung tâm dữ liệu và tạo ra các thiết kế tham chiếu cho công nghệ AI và digital twin trong trung tâm dữ liệu.
- Các thiết kế này nhằm tái định nghĩa các chuẩn mực triển khai và vận hành AI trong hệ sinh thái trung tâm dữ liệu.
- Trong giai đoạn đầu, Schneider Electric sẽ cung cấp các thiết kế được điều chỉnh cho các cụm xử lý dữ liệu của NVIDIA, tập trung vào việc cho phép phân phối điện công suất cao, hệ thống làm mát bằng chất lỏng và các bộ điều khiển đảm bảo việc đưa vào hoạt động đơn giản và vận hành đáng tin cậy của các cụm mật độ cao.
- Các chủ sở hữu, nhà khai thác, kỹ sư trung tâm dữ liệu và các đối tác khác có thể sử dụng các thiết kế tham chiếu này cho các phòng trung tâm dữ liệu hiện có cần hỗ trợ triển khai mới các máy chủ AI mật độ cao và xây dựng trung tâm dữ liệu mới được tối ưu hóa cho các cụm AI làm mát bằng chất lỏng.
- Khung tổng thể dự kiến sẽ đẩy nhanh việc triển khai nền tảng điện toán tăng tốc của NVIDIA trong các trung tâm dữ liệu, đồng thời tối ưu hóa hiệu suất, khả năng mở rộng và tính bền vững tổng thể.
- Việc áp dụng nhanh chóng AI tạo sinh, điện toán biên và công nghệ digital twin dự kiến sẽ tiếp tục thúc đẩy mật độ giá đỡ cao hơn trong các trung tâm dữ liệu. Mật độ cao hơn tạo ra nhiệt đáng kể và khiến việc làm mát trung tâm dữ liệu trở nên khó khăn hơn.
- Để quản lý mật độ cao hơn trong các trung tâm mới và hiện có, các nhà khai thác sẽ cần sử dụng phần mềm quản lý và giám sát thông minh để tăng hiệu quả và cắt giảm chi phí vận hành.
- Aveva, công ty con của Schneider Electric, sẽ kết nối nền tảng digital twin của mình với nền tảng mô phỏng Omniverse của NVIDIA để cung cấp một môi trường ảo thống nhất cho phép cộng tác giữa các nhà thiết kế, kỹ sư và các bên liên quan, đẩy nhanh việc triển khai các hệ thống phức tạp.
- Schneider Electric công bố sẽ đầu tư 140 triệu USD để nâng cấp các cơ sở sản xuất của mình tại Mỹ trong năm nay nhằm đáp ứng nhu cầu ngày càng tăng đối với các trung tâm dữ liệu.

📌 Sự hợp tác giữa Schneider Electric và NVIDIA nhằm tối ưu hóa cơ sở hạ tầng trung tâm dữ liệu cho AI, với các thiết kế tham chiếu cho phép triển khai nhanh các cụm máy chủ mật độ cao sử dụng hệ thống làm mát chất lỏng. Khung tổng thể sẽ đẩy nhanh việc áp dụng nền tảng điện toán tăng tốc của NVIDIA, tối ưu hóa hiệu suất và tính bền vững. Schneider Electric cũng đầu tư 140 triệu USD vào các cơ sở sản xuất tại Mỹ để đáp ứng nhu cầu tăng trưởng của thị trường trung tâm dữ liệu.

https://www.facilitiesdive.com/news/schneider-electric-nvidia-data-center-design-ai-liquid-cooling-density/711002/

Không có file đính kèm.

Nguồn tham khảo

124

AI chips-hardware-compute 2024-03-21 15:06:53

Đan Mạch sẽ có siêu máy tính AI mạnh mẽ và trung tâm nghiên cứu đẳng cấp thế giới

- Quỹ từ thiện giàu nhất thế giới Novo Nordisk Foundation của Đan Mạch hợp tác với NVIDIA và Quỹ Đầu tư Đan Mạch để thành lập trung tâm nghiên cứu AI quốc gia.
- Trung tâm sẽ sở hữu một trong những siêu máy tính AI mạnh nhất thế giới mang tên Gefion, do Eviden (Pháp) xây dựng.
- Siêu máy tính sẽ được sử dụng cho các khám phá khoa học đột phá trong lĩnh vực dược phẩm, chẩn đoán và điều trị bệnh.
- NVIDIA, công ty đa quốc gia có trụ sở tại California, là nhà cung cấp phần cứng AI thống trị và là một trong những công ty lớn nhất trên thị trường chứng khoán Mỹ với giá trị khoảng 2.234 nghìn tỷ USD.
- Đan Mạch được coi là trung tâm nghiên cứu AI đang phát triển mạnh mẽ. Việc thiếu siêu máy tính đủ khả năng là rào cản chính cho sự tiến bộ.
- Đây là một trong nhiều hợp tác gần đây của NVIDIA, bao gồm các thỏa thuận với Scaleaway, Microsoft và Amazon về điện toán đám mây và kỹ thuật siêu máy tính cho AI tạo sinh.
- Trung tâm AI mới của Đan Mạch sẽ sẵn sàng cho các dự án thí điểm trước cuối năm nay, với ngân sách ban đầu 700 triệu DKK (93,8 triệu EUR).

📌 Sự hợp tác giữa Quỹ Novo Nordisk, NVIDIA và chính phủ Đan Mạch nhằm xây dựng siêu máy tính AI Gefion cùng trung tâm nghiên cứu trị giá 93,8 triệu EUR hứa hẹn đưa Đan Mạch trở thành trung tâm nghiên cứu AI hàng đầu, mở ra cơ hội cho những khám phá khoa học đột phá trong y dược.

https://www.euronews.com/next/2024/03/20/denmark-to-get-powerful-ai-supercomputer-and-research-centre

Không có file đính kèm.

Nguồn tham khảo

115

AI chips-hardware-compute Semi-Cloud-DC-Green 2024-03-21 01:06:34

Mỹ cân nhắc trừng phạt mạng lưới chip bí mật của Huawei tại Trung Quốc

- Chính quyền Biden đang xem xét đưa một số công ty bán dẫn Trung Quốc có liên quan đến Huawei vào danh sách đen sau khi công ty này đạt được bước đột phá công nghệ đáng kể vào năm ngoái.
- Các công ty Trung Quốc có thể bị ảnh hưởng bao gồm Qingdao Si'En, SwaySure, Shenzhen Pensun Technology Co. (PST), ChangXin Memory Technologies Inc. (CXMT), Shenzhen Pengjin High-Tech Co. và SiCarrier.
- Mỹ lo ngại rằng Shenzhen Pengjin và SiCarrier đang hành động như những công ty ủy nhiệm để giúp Huawei có được thiết bị bị hạn chế.
- Chính phủ Mỹ đang gây áp lực lên các đồng minh như Hà Lan, Đức, Hàn Quốc và Nhật Bản để siết chặt hơn nữa các hạn chế đối với khả năng tiếp cận công nghệ bán dẫn của Trung Quốc.
- Huawei đã ra mắt một thiết bị Mate 60 được cung cấp sức mạnh bởi chip 7nm được sản xuất tại Trung Quốc vào tháng 8/2023, cho thấy công ty vẫn có thể tiến bộ bất chấp các lệnh trừng phạt hiện có.
- Chip xử lý được sản xuất bởi SMIC, mặc dù vẫn phụ thuộc rất nhiều vào công nghệ nước ngoài, bao gồm cả công cụ từ ASML (Hà Lan), Applied Materials và Lam Research (Mỹ).

📌 Mỹ đang xem xét trừng phạt nhiều công ty bán dẫn Trung Quốc liên quan đến Huawei sau khi gã khổng lồ viễn thông này đạt được bước đột phá công nghệ đáng kể với chip 7nm vào năm 2023. Động thái này nhằm kiềm chế tham vọng AI và bán dẫn của Bắc Kinh, đồng thời gây áp lực lên Huawei và SMIC - hai công ty đang nỗ lực giảm sự phụ thuộc vào công nghệ phương Tây bất chấp các lệnh trừng phạt hiện có.

https://www.bloomberg.com/news/articles/2024-03-20/us-weighs-sanctioning-huawei-s-secretive-chinese-chip-network

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2024-03-19 23:33:16

Giám đốc điều hành Nvidia nhấn mạnh sự thiếu hụt cơ sở hạ tầng điện toán của Ấn Độ, nhìn thấy tiềm năng AI

Meta descriptions (in Vietnamese): Vishal Dhupar, giám đốc điều hành của Nvidia, nhấn mạnh sự thiếu hụt cơ sở hạ tầng điện toán của Ấn Độ, chỉ chiếm dưới 2% trong tổng số 1 nghìn tỷ đô la toàn cầu. Tuy nhiên, ông nhìn thấy tiềm năng to lớn của Ấn Độ trong lĩnh vực AI nếu nâng cao năng lực tính toán.

Meta keywords (in Vietnamese): Vishal Dhupar, Nvidia, cơ sở hạ tầng điện toán, Ấn Độ, tiềm năng AI, năng lực tính toán, nghiên cứu AI, đầu tư nghiên cứu, nền kinh tế Ấn Độ, mô hình AI, ngôn ngữ Ấn Độ, văn hóa Ấn Độ, Yotta Data Services, GPU

SEO title (in Vietnamese): Giám đốc điều hành Nvidia nhấn mạnh sự thiếu hụt cơ sở hạ tầng điện toán của Ấn Độ, nhìn thấy tiềm năng AI

Tóm tắt chi tiết 400 từ:
- Vishal Dhupar, giám đốc điều hành của Nvidia, chỉ ra rằng Ấn Độ chỉ chiếm dưới 2% trong tổng số 1 nghìn tỷ đô la cơ sở hạ tầng điện toán toàn cầu, tụt hậu xa so với Mỹ và Trung Quốc (chiếm gần 60%).
- Dhupar nhìn thấy cơ hội vàng cho Ấn Độ trở thành cường quốc AI của thế giới, với điều kiện tăng cường năng lực tính toán.
- Ấn Độ chỉ đóng góp khoảng 2% vào nghiên cứu AI toàn cầu do thiếu tài nguyên tính toán, trong khi người Ấn ở nước ngoài đóng góp 12% nhờ cơ sở hạ tầng tốt hơn.
- Mỹ và Trung Quốc đầu tư khoảng 4% GDP cho nghiên cứu, trong khi Ấn Độ chỉ 1%. Cần nâng cấp cơ sở hạ tầng để thúc đẩy đổi mới và có thể bổ sung 1 nghìn tỷ đô la vào nền kinh tế Ấn Độ.
- Chính phủ Ấn Độ đã đưa ra Sứ mệnh AI Ấn Độ nhằm giới thiệu 10.000 GPU, là bước tiến quan trọng.
- Dhupar hình dung Ấn Độ chuyển từ "văn phòng hậu cần của thế giới" sang dẫn đầu đổi mới AI, đặc biệt trong việc mã hóa ngôn ngữ và văn hóa Ấn Độ vào các mô hình AI.
- Nvidia hợp tác với Yotta Data Services mang 16.000 GPU đến Ấn Độ để tăng cường cơ sở hạ tầng và hỗ trợ hơn 1.600 startup Ấn Độ trong chương trình Nvidia Inception, bao gồm 400 startup AI và 60 startup AI tạo sinh.

📌 Mặc dù chỉ chiếm dưới 2% cơ sở hạ tầng điện toán toàn cầu trị giá 1 nghìn tỷ đô la, Ấn Độ có tiềm năng trở thành cường quốc AI nếu tăng cường năng lực tính toán. Với sự hỗ trợ của chính phủ và các công ty như Nvidia mang GPU đến Ấn Độ, quốc gia này có thể chuyển từ "văn phòng hậu cần" sang dẫn đầu đổi mới AI, mã hóa ngôn ngữ và văn hóa Ấn Độ vào các mô hình, đồng thời thúc đẩy phát triển startup trong nước.

https://in.benzinga.com/content/37811798/nvidia-exec-highlights-indias-scarcity-in-compute-infrastructure-sees-ai-potential

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2024-03-19 23:03:51

CEO Jensen Huang công bố GPU "khủng khiếp" Blackwell, đánh dấu sự chuyển sang kỷ nguyên của AI tạo sinh (generative AI), vượt qua định luật Moore

• Tại sự kiện NVIDIA GTC 2024, CEO Jensen Huang công bố GPU "khủng khiếp" mới có tên Blackwell, đánh dấu sự chuyển sang kỷ nguyên mới của AI tạo sinh (generative AI), vượt qua luật Moore truyền thống.

• Trong 8 năm qua, NVIDIA đã tăng khả năng tính toán gấp 1.000 lần, vượt xa so với thời kỳ đỉnh cao của luật Moore, nhưng vẫn chưa đủ để đáp ứng nhu cầu ngày càng tăng của ngành công nghiệp.

• Huang cho rằng tương lai thuộc về AI tạo sinh, vì vậy họ đã tạo ra bộ xử lý đặc biệt cho kỷ nguyên này, với khả năng tạo sinh nội dung token (content token generation) ở định dạng FP4 mới.

• Blackwell cung cấp 20 petaflops sức mạnh, hỗ trợ mô hình AI quy mô nghìn tỷ tham số, với hiệu suất cao gấp 30 lần so với thế hệ trước cho việc suy luận mô hình ngôn ngữ lớn (LLM inference).

• Kiến trúc mới có Tensor Engine thế hệ 2 để nhân đôi kích thước mô hình AI, kết nối NVLink thế hệ 5 cho phép tối đa 576 GPU làm việc đồng bộ, và công nghệ đảm bảo tin cậy cho quá trình huấn luyện kéo dài nhiều tuần.

• Các hãng công nghệ lớn như Amazon, Google, Microsoft và Tesla đã cam kết sử dụng Blackwell.

• So với kiến trúc Hopper trước đây, Blackwell chỉ cần 2.000 GPU và ít năng lượng hơn (4 megawatt) để huấn luyện mô hình GPT-4 1,8 nghìn tỷ tham số trong cùng khoảng thời gian 90 ngày.

• NVIDIA cũng giới thiệu siêu máy tính AI DGX SuperPOD mới với tối đa 576 GPU Blackwell và 11,5 exaflops sức mạnh tính toán AI.

• Trong khi Intel và AMD đang đuổi theo, Blackwell của NVIDIA nâng tầm mới cho AI tạo sinh quy mô lớn thông qua các đổi mới kiến trúc được thiết kế riêng.

📌 Với Blackwell, NVIDIA tái định nghĩa định luật Moore, mở ra kỷ nguyên mới của AI tạo sinh quy mô nghìn tỷ tham số, cung cấp sức mạnh tính toán khổng lồ 20 petaflops/GPU và hiệu suất cao gấp 30 lần cho suy luận LLM.

https://analyticsindiamag.com/nvidia-rewrites-moores-law-with-blackwell/

Không có file đính kèm.

Nguồn tham khảo

127

AI chips-hardware-compute 2024-03-19 18:36:20

Nvidia trình làng siêu máy tính DGX SuperPOD mới xử lý mô hình AI nghìn tỷ tham số

- Nvidia giới thiệu hệ thống DGX SuperPOD mới, một phần của việc ra mắt phần cứng và phần mềm rộng rãi tại hội nghị Nvidia GTC.
- DGX SuperPOD được trang bị GPU thế hệ tiếp theo của Nvidia cho tăng tốc AI, được gọi là Blackwell, hỗ trợ các mô hình AI có hàng nghìn tỷ tham số.
- DGX SuperPOD tích hợp siêu chip GB200 phiên bản của Blackwell, bao gồm cả tài nguyên CPU và GPU.
- Mỗi hệ thống DGX GB200 có 36 siêu chip Nvidia GB200, bao gồm 36 CPU Nvidia Grace và 72 GPU Nvidia Blackwell, kết nối thành một siêu máy tính duy nhất thông qua Nvidia NVLink thế hệ thứ 5.
- DGX SuperPOD có thể được cấu hình với 8 hoặc nhiều hơn hệ thống DGX GB200 và có thể mở rộng lên hàng chục nghìn siêu chip GB200 được kết nối thông qua Nvidia Quantum InfiniBand.
- Hệ thống có thể cung cấp 240 terabyte bộ nhớ, rất quan trọng cho việc đào tạo mô hình ngôn ngữ lớn (LLM) và suy luận AI tạo sinh ở quy mô lớn.
- DGX SuperPOD có sức mạnh tính toán AI 11,5 exaflops.
- Công nghệ mạng Nvidia Quantum-X800 InfiniBand cung cấp băng thông lên tới 1.800 gigabyte/giây cho mỗi GPU trong nền tảng.
- DGX cũng tích hợp DPU Nvidia BlueField-3 và kết nối Nvidia NVLink thế hệ thứ 5.
- SuperPOD mới bao gồm công nghệ Nvidia Scalable Hierarchical Aggregation and Reduction Protocol (SHARP) thế hệ thứ 4, cung cấp 14,4 teraflops tính toán trong mạng.
- Các hệ thống DGX mới dựa trên GB200 cũng sẽ có trên dịch vụ đám mây Nvidia DGX, đầu tiên trên Amazon Web Services (AWS), Google Cloud và Oracle Cloud.
- Project Ceiba, siêu máy tính mà Nvidia đang phát triển với AWS, đã được nâng cấp lên Grace Blackwell hỗ trợ 20.000 GPU, cung cấp hơn 400 exaflops AI.

📌 Nvidia đã ra mắt hệ thống DGX SuperPOD mới mạnh nhất từ trước đến nay, tích hợp GPU Blackwell thế hệ tiếp theo, hỗ trợ các mô hình AI với hàng nghìn tỷ tham số. Hệ thống cung cấp 240 TB bộ nhớ, sức mạnh tính toán AI 11,5 exaflops và mạng Quantum-X800 InfiniBand băng thông cao. DGX SuperPOD cũng sẽ có mặt trên dịch vụ đám mây DGX và Project Ceiba siêu máy tính với 20.000 GPU, cung cấp hơn 400 exaflops AI.

https://venturebeat.com/ai/nvidias-new-dgx-superpod-can-handle-trillion-parameter-ai-models/

Không có file đính kèm.

Nguồn tham khảo

111

AI chips-hardware-compute 2024-03-19 18:28:07

Rebellions - đối thủ Hàn Quốc của Nvidia trong cuộc đua chip AI sẽ bắt đầu sản xuất hàng loạt NPU với sự hậu thuẫn của Samsung

- Rebellions, một công ty chip AI fabless được đồng sáng lập bởi 5 kỹ sư Hàn Quốc vào năm 2020, được coi là hy vọng lớn nhất của nước này để cạnh tranh với Nvidia trong lĩnh vực suy luận AI.
- Chip Atom NPU mới nhất của Rebellions nhắm đến các mô hình AI được huấn luyện với tối đa 7 tỷ tham số và sẽ được Samsung Electronics sản xuất hàng loạt với công nghệ 5nm trong nửa đầu năm nay.
- Atom tiết kiệm năng lượng hơn tới 5 lần so với GPU A100 của Nvidia, nhưng độ trễ chỉ bằng một nửa so với A2 của Nvidia trong bài kiểm tra chuẩn suy luận mô hình ngôn ngữ.
- Rebellions đã huy động được 124 triệu USD trong vòng gọi vốn do KT dẫn đầu vào tháng 1, nâng định giá của công ty lên 650 triệu USD.
- KT, nhà khai thác viễn thông lớn thứ hai và công ty trung tâm dữ liệu lớn nhất Hàn Quốc, sẽ trở thành khách hàng đầu tiên của Rebellions sau khi sản xuất hàng loạt Atom bắt đầu.
- Rebellions và Samsung đã công bố kế hoạch đồng phát triển Rebel, NPU thế hệ tiếp theo của công ty khởi nghiệp sau Atom, nhắm vào các mô hình ngôn ngữ lớn (LLM) và cạnh tranh với GPU H200 cao cấp của Nvidia trong các tác vụ suy luận.

📌 Rebellions đang nổi lên như một đối thủ đáng gờm của Nvidia tại Hàn Quốc trong lĩnh vực chip AI, với sự hậu thuẫn của các gã khổng lồ công nghệ như Samsung, KT và Kakao. Công ty đặt mục tiêu đạt 30% thị phần chip suy luận dùng cho LLM tại Hàn Quốc trong 2,5 năm tới và 3-5% thị phần toàn cầu, cạnh tranh trực tiếp với Nvidia vốn đang thống trị tới 90% thị trường chip AI toàn cầu.

https://www.scmp.com/tech/tech-trends/article/3255845/south-koreas-nvidia-wannabe-ai-chip-start-rebellions-begin-mass-production-npus-backed-samsung

Không có file đính kèm.

Nguồn tham khảo

108

AI chips-hardware-compute 2024-03-19 16:20:15

Nvidia ra mắt nền tảng Blackwell kết hợp sức mạnh của 2 chip, tốc độ 10 Tbps, nhanh hơn 2 đến 30 lần so với thế hệ GPU trước

- Sự kiện GTC của Nvidia được tổ chức tại SAP Center ở San Jose với sự tham dự đông đảo của khán giả.
- Jensen Huang, CEO 61 tuổi của Nvidia, giới thiệu về "tính toán tăng tốc" - sứ mệnh của công ty nhằm đẩy giới hạn của tính toán thông thường.
- Nvidia ra mắt nền tảng Blackwell mới, kết hợp sức mạnh của hai chip, cung cấp tốc độ 10 Tbps, nhanh hơn 2 đến 30 lần so với thế hệ GPU tối ưu hóa AI trước đó là Hopper.
- Với hệ thống mới, chỉ cần 2.000 GPU và sử dụng 25% năng lượng so với 8.000 GPU, 15 megawatt và 90 ngày để tạo ra mô hình GPT-MoE-1.8T.
- Nvidia giới thiệu các công cụ mới cho các nhà sản xuất ô tô đang phát triển xe tự lái và tăng cường sự hiện diện trong lĩnh vực robot với các công cụ giúp robot thông minh hơn.
- Nvidia NIM, một nền tảng phần mềm nhằm đơn giản hóa việc triển khai các mô hình AI, hỗ trợ các mô hình từ Nvidia, Google, Hugging Face và tích hợp với Amazon SageMaker, Microsoft Azure AI.
- Jensen Huang nhấn mạnh: "Bất cứ thứ gì bạn có thể số hóa, miễn là có một số cấu trúc để áp dụng các mẫu, có nghĩa là chúng ta có thể học các mẫu đó. Và nếu chúng ta có thể học các mẫu, chúng ta có thể hiểu ý nghĩa. Khi chúng ta hiểu ý nghĩa, chúng ta cũng có thể tạo ra nó."

📌 Nvidia ra mắt nền tảng Blackwell mới, kết hợp sức mạnh của hai chip, cung cấp tốc độ 10 Tbps, nhanh hơn 2 đến 30 lần so với thế hệ GPU tối ưu hóa AI trước đó là Hopper. Với hệ thống mới, chỉ cần 2.000 GPU và sử dụng 25% năng lượng so với 8.000 GPU, 15 megawatt và 90 ngày để tạo ra mô hình GPT-MoE-1.8T.

https://techcrunch.com/2024/03/18/nvidia-keynote-gtc-2024/

Không có file đính kèm.

Nguồn tham khảo

119

AI chips-hardware-compute 2024-03-19 16:15:22

HPE và Supermicro tung siêu máy tính AI tạo sinh mạnh nhất từ trước đến nay với GPU Blackwell của Nvidia

- HPE giới thiệu nền tảng siêu máy tính AI tạo sinh tại chỗ, giúp các công ty tạo, tinh chỉnh và chạy các mô hình ngôn ngữ lớn mạnh mẽ trong trung tâm dữ liệu của riêng họ.
- Hệ thống được trang bị GPU GH200 Grace Hopper Superchips của Nvidia, tích hợp công nghệ mạng Ethernet Spectrum-X, đơn vị xử lý dữ liệu BlueField-3 và phần mềm máy học và phân tích của HPE.
- Nền tảng hỗ trợ các mô hình ngôn ngữ lớn (LLM) độc quyền và nguồn mở, lý tưởng cho tinh chỉnh nhẹ, tạo sinh được tăng cường bởi truy xuất dữ liệu ngoài (RAG) và suy luận quy mô lớn.
- HPE cũng phát triển phần mềm Machine Learning Inference, tích hợp với microservices NIM mới của Nvidia để triển khai nhanh và an toàn các mô hình AI.
- Supermicro công bố các máy chủ đầu tiên sử dụng GPU Blackwell mới của Nvidia, bao gồm GB200 Grace Blackwell Superchip, B200 và B100 Tensor Core GPUs.
- Các hệ thống HGX B200 8-GPU và HGX B100 8-GPU mới của Supermicro sẽ mang lại hiệu suất cao gấp 3 lần so với các hệ thống sử dụng kiến trúc Hopper cũ hơn của Nvidia.
- Supermicro cũng giới thiệu máy chủ MGX mới sử dụng GB200 Grace Blackwell Superchip, mang lại hiệu suất suy luận AI cao gấp 30 lần so với thế hệ Superchip trước.
- Máy chủ quy mô giá đỡ mới nhất của Supermicro dựa trên Nvidia GB200 NVL72 sẽ kết nối 36 CPU Nvidia Grace với 72 GPU Blackwell trong một giá đỡ duy nhất, sử dụng công nghệ NVLink mới nhất.

📌 HPE và Supermicro đã ra mắt các nền tảng siêu máy tính AI tạo sinh mạnh mẽ nhất từ trước đến nay, sử dụng GPU Blackwell tiên tiến của Nvidia. Các hệ thống mới hỗ trợ tinh chỉnh mô hình nhẹ, RAG và suy luận quy mô lớn, mang lại hiệu suất cao gấp 3 đến 30 lần so với các thế hệ trước, đáp ứng nhu cầu ngày càng tăng về khả năng xử lý AI tạo sinh tại chỗ.

https://siliconangle.com/2024/03/18/hpe-debuts-nvidia-gpu-powered-premises-supercomputer-generative-ai/

Không có file đính kèm.

Nguồn tham khảo

118

AI chips-hardware-compute 2024-03-18 22:25:18

nvidia sắp ra mắt siêu chip ai thế hệ mới tại "woodstock của ai"

- Nvidia dự kiến sẽ ra mắt thế hệ chip tiếp theo, B100, tại hội nghị GPU Technology Conference (GTC) thường niên ở San Jose, California.
- CEO Jensen Huang sẽ đồng tổ chức sự kiện cùng các nhân vật quyền lực trong ngành AI như Brad Lightcap (COO OpenAI) và Arthur Mensch (CEO Mistral AI).
- Chip B100 được đồn đoán là chip đa die đầu tiên của Nvidia, với thiết kế lớn được chia thành các phần nhỏ hơn, hứa hẹn mạnh mẽ hơn người tiền nhiệm H100.
- Microsoft và Meta là khách hàng lớn nhất của chip H100, chi 9 tỷ đô la cho các chip này trong năm 2023. Alphabet, Amazon và Oracle cũng là những khách hàng chi tiêu hàng đầu.
- Sự cuồng nhiệt với chip H100 của Nvidia khiến một số công ty lo ngại về tình trạng thiếu hụt, và các đối thủ cạnh tranh đã bắt đầu tự xây dựng các phiên bản chip của riêng mình.
- Nvidia đang trên đà tăng trưởng mạnh mẽ, trở thành công ty bán dẫn đầu tiên đạt mức vốn hóa 2 nghìn tỷ đô la vào tháng 2.
- Công ty đã vượt qua Amazon và Alphabet để trở thành công ty có giá trị vốn hóa thị trường lớn thứ ba tại Mỹ, và vượt qua Aramco của Ả Rập Xê Út để trở thành công ty có giá trị lớn thứ ba thế giới vào tháng 3.
- Tuy nhiên, Wall Street vẫn chưa thể quyết định về thành công của Nvidia, một số cho rằng sự thành công này chỉ là bong bóng và sẽ sớm vỡ.

📌 Nvidia dự kiến ra mắt chip B100 thế hệ mới tại hội nghị GPU Technology Conference (GTC) thường niên, hứa hẹn mạnh mẽ hơn với thiết kế đa die.

https://qz.com/nvidia-new-chip-reveal-h100-b100-1851343814

Không có file đính kèm.

Nguồn tham khảo

120

AI chips-hardware-compute 2024-03-18 22:21:09

Bất chấp lệnh cấm vận của Mỹ, Trung Quốc vẫn tiếp cận được GPU Nvidia H100 cho AI

- Theo báo cáo của Telegraph, các nhà nghiên cứu tại Trung Quốc đã có thể vượt qua lệnh cấm vận của Mỹ về xuất khẩu GPU sang Trung Quốc, minh chứng là sự tồn tại của một số bài báo nghiên cứu gần đây sử dụng GPU Nvidia H100.
- Điều này bất chấp thực tế rằng H100 đã bị cấm xuất khẩu sang Trung Quốc từ năm 2022, cho thấy kiểm soát xuất khẩu chưa thực sự chặt chẽ.
- Tuy nhiên, số lượng H100 được đề cập trong các bài báo nghiên cứu này cho thấy Trung Quốc hiện không nhận được nhiều GPU này.
- Lệnh cấm vận GPU đầu tiên của Mỹ đối với Trung Quốc diễn ra vào tháng 8/2022, tác động đến H100 và A100 cao cấp, ngăn chúng được bán tại Trung Quốc.
- Telegraph đã phát hiện 4 bài báo nghiên cứu gần đây được viết tại Trung Quốc dựa trên việc thử nghiệm một hoặc nhiều GPU H100.
- Trong số các công ty hỗ trợ các nhà nghiên cứu này có 4paradigm, một công ty AI nhưng bị Mỹ đưa vào danh sách cấm vận vì nghi ngờ chuyển giao công nghệ Mỹ cho quân đội Trung Quốc.
- Các bài báo khác được tài trợ bởi ngân sách khoa học của chính phủ Trung Quốc.
- Nvidia rõ ràng không bán trực tiếp các GPU này cho Trung Quốc vì sẽ vi phạm pháp luật. Trung Quốc có thể mua chúng qua thị trường cũ từ các nước khác.
- Kiểm soát xuất khẩu H100 đang ngày càng nghiêm ngặt hơn, mở rộng sang Trung Đông, để ngăn Trung Quốc tiếp cận thêm.
- Buôn lậu chip cũng có thể đóng vai trò đưa GPU Nvidia vào Trung Quốc, khi các hoạt động buôn lậu ngày càng lớn và phức tạp hơn.
- Mỹ từng nghi ngờ một công ty Trung Quốc cố gắng buôn lậu GPU A100 đến Úc rồi chuyển sang Trung Quốc.
- Điểm sáng là các bài báo nghiên cứu thường chỉ liên quan đến 8 GPU H100 trở xuống, cho thấy số lượng có sẵn tại Trung Quốc không nhiều.

📌 Mặc dù bị Mỹ cấm vận, Trung Quốc vẫn có thể tiếp cận GPU Nvidia H100 cao cấp thông qua các kênh như mua cũ từ nước khác hay buôn lậu. Tuy nhiên, số lượng hạn chế trong các nghiên cứu gần đây cho thấy Trung Quốc chưa có đủ H100 để xây dựng trung tâm dữ liệu AI quy mô lớn và có thể phải dựa vào các GPU nội địa như Ascend của Huawei.

https://www.tomshardware.com/pc-components/gpus/despite-us-sanctions-researchers-in-china-can-still-access-high-end-nvidia-gpus-for-ai

Không có file đính kèm.

Nguồn tham khảo

111

AI chips-hardware-compute 2024-03-16 16:50:24

Startup chip AI Groq thu hút sự chú ý với tốc độ vượt trội và kế hoạch huy động vốn mới

- Groq, một startup chip AI được hậu thuẫn bởi Tiger Global và Addition của Lee Fixel, đang chuẩn bị huy động vòng tài trợ mới vào quý tới sau khi nhận được một khoản tiền mặt nhỏ gần đây.

- Công ty tuyên bố chip AI của họ, được gọi là "đơn vị xử lý ngôn ngữ" (LPU), có thể nhanh hơn 10 lần và rẻ hơn 1/10 so với phần cứng AI thông thường.

- Hiện tại, Groq đã triển khai khoảng 4.500 chip và dự kiến sẽ đạt 1,5 triệu chip vào cuối năm tới.

- Công ty đã huy động được 367 triệu USD, gần đây nhất là vòng 300 triệu USD vào năm 2021 với định giá 1,1 tỷ USD.

- Chiến lược của Groq gồm bán quyền truy cập cho các nhà phát triển muốn chạy phần mềm AI trên cơ sở hạ tầng đám mây của họ và bán phần cứng cho khách hàng vận hành trung tâm dữ liệu riêng.

- Groq gần đây đã mua lại Definitive Intelligence để mở rộng các dịch vụ cho khách hàng và nhà phát triển.

- Với sự bùng nổ của công nghệ AI tạo sinh, nhu cầu về chip máy tính chuyên dụng tăng vọt nhưng nguồn cung chưa theo kịp. Groq đang đặt cược rằng họ có thể chiếm lĩnh một phần thị trường.

- Groq cũng tự quảng cáo là giải pháp thân thiện với môi trường hơn so với cơ sở hạ tầng thông thường.

- Công ty đã ký thỏa thuận với một đối tác chưa được tiết lộ để triển khai hơn 10% trong số 1,5 triệu LPU mà họ đặt mục tiêu đến cuối năm 2025.

📌 Groq đang thu hút sự chú ý với chip AI siêu nhanh và giá thành thấp. Công ty đã huy động 367 triệu USD, triển khai 4.500 chip và đặt mục tiêu 1,5 triệu chip vào cuối 2025. Groq đang đặt cược vào nhu cầu tính toán suy luận tăng vọt và tự định vị là giải pháp thân thiện môi trường. Thỏa thuận với đối tác bí mật hứa hẹn triển khai quy mô lớn.

https://www.axios.com/2024/03/16/artificial-intelligence-groq-social-capital

Không có file đính kèm.

Nguồn tham khảo

111

AI chips-hardware-compute Semi-Cloud-DC-Green 2024-03-15 17:21:07

Chi tiêu cho điện toán biên sẽ tăng vọt khi AI phát triển mạnh

- IDC dự báo chi tiêu cho điện toán biên có thể đạt 350 tỷ USD vào năm 2027, vượt qua ước tính trước đó, do sự tích hợp các ứng dụng AI vào cơ sở hạ tầng biên.
- Để đáp ứng yêu cầu về khả năng mở rộng và hiệu suất, các tổ chức cần áp dụng cách tiếp cận phân tán mà điện toán biên cung cấp.
- Dự báo tăng trưởng dựa trên 500 trường hợp sử dụng của doanh nghiệp trên 19 ngành và 6 lĩnh vực.
- Năm nay, multi-access edge computing (MEC), mạng phân phối nội dung và các chức năng mạng ảo dự kiến chiếm khoảng 22% tổng chi tiêu cho điện toán biên.
- Trong 24 tháng qua, đầu tư của doanh nghiệp đã chuyển dịch sang mở rộng cơ sở hạ tầng và triển khai trên các lĩnh vực mới.
- IDC dự đoán tốc độ tăng trưởng kép hàng năm (CAGR) trong 5 năm ở mức 2 con số thấp đến trung bình cho 19 ngành được khảo sát và 19,1% cho phân khúc nhà cung cấp dịch vụ.
- Các trường hợp sử dụng điện toán biên mới nổi như thực tế tăng cường, trí tuệ nhân tạo và hoạt động tự động sẽ là trọng tâm trong tương lai.
- Đầu tư tập trung chủ yếu ở Bắc Mỹ, Tây Âu và Trung Quốc, trong đó riêng Bắc Mỹ dự kiến chiếm khoảng 40% tổng chi tiêu. Tăng trưởng cũng được kỳ vọng ở châu Phi và Trung Đông.

📌 Dự báo của IDC cho thấy chi tiêu cho điện toán biên sẽ tăng mạnh lên 350 tỷ USD vào năm 2027, tăng trưởng 2 con số ở 19 ngành, do nhu cầu tích hợp AI. Bắc Mỹ chiếm 40% tổng đầu tư. Các ứng dụng mới như AR, AI, tự động hóa sẽ là trọng tâm phát triển.

https://www.techradar.com/pro/edge-computing-spending-set-to-skyrocket-as-ai-takes-hold

Không có file đính kèm.

Nguồn tham khảo

116

AI chips-hardware-compute 2024-03-15 16:48:13

OpenAI nhận được sự hậu thuẫn từ UAE cho liên doanh chip AI, bước đầu tiên để hiện thực hóa giấc mơ 7 nghìn tỷ đô la của Sam Altman

- MGX, công ty đầu tư tập trung vào AI mới ra mắt tại Abu Dhabi đang đàm phán để đầu tư vào liên doanh chip của OpenAI.
- Động thái này diễn ra một tháng sau khi giám đốc OpenAI Sam Altman chia sẻ tham vọng gây quỹ 7 nghìn tỷ đô la cho liên doanh chip AI nhằm giảm sự phụ thuộc vào các ông lớn bán dẫn hiện nay.
- MGX được tài trợ bởi nhà nước UAE và do cố vấn an ninh quốc gia Sheikh Tahnoon bin Zayed-al-Nahyan lãnh đạo.
- Việc tài trợ sẽ thúc đẩy sự hiện diện của UAE trên thị trường AI thế giới khi họ muốn cạnh tranh với các công ty công nghệ lớn phương Tây.
- Năm ngoái, OpenAI hợp tác với G42, công ty holding AI của UAE do Sheikh Tahnoon làm chủ tịch, để G42 tận dụng các mô hình AI tạo sinh của OpenAI cho các lĩnh vực công nghiệp UAE.
- Elon Musk cũng đang tìm kiếm quan hệ đối tác chiến lược với UAE để mở rộng thị trường cho công ty AI xAI của mình.
- Giấc mơ gây quỹ hàng nghìn tỷ đô la của Altman liên quan đến kế hoạch phá vỡ thị trường chip AI hiện do Intel và TSMC thống trị.

📌 OpenAI đang nhận được sự hậu thuẫn từ UAE cho liên doanh chip AI trị giá 7 nghìn tỷ đô la, đồng thời mở rộng hoạt động tại quốc gia Trung Đông này thông qua hợp tác với G42. Elon Musk cũng đang tìm cách thiết lập quan hệ đối tác với UAE cho công ty xAI.

https://analyticsindiamag.com/openai-to-receive-uae-backing-for-ai-chip-venture/

Không có file đính kèm.

Nguồn tham khảo

113

Semi-Cloud-DC-Green AI chips-hardware-compute 2024-03-14 16:30:41

Động lực cơ sở hạ tầng AI để thúc đẩy vốn đầu tư của trung tâm dữ liệu lên 17% vào năm 2024

- Báo cáo mới từ Dell'Oro Group dự báo chi tiêu vốn của các trung tâm dữ liệu siêu cấp sẽ tăng 17% trong năm 2024, nhờ đầu tư vào cơ sở hạ tầng điện toán và AI.
- Sau mức tăng trưởng khiêm tốn 4% vào năm 2023, chi tiêu vốn trung tâm dữ liệu toàn cầu dự kiến sẽ phục hồi mạnh mẽ trong năm nay.
- Điện toán tăng tốc cho các ứng dụng AI tạo sinh dự kiến sẽ dẫn đầu các khoản đầu tư trung tâm dữ liệu, cùng với sự phục hồi vừa phải của nhu cầu máy chủ và lưu trữ đa năng.
- Báo cáo cũng dự đoán doanh thu từ máy chủ và hệ thống lưu trữ sẽ tăng 18% vào năm 2024, với sự chuyển dịch sang máy chủ tối ưu hóa AI và nền tảng máy chủ với các CPU mới nhất từ Intel, AMD và ARM.
- Đến năm 2028, lượng máy chủ xuất xưởng toàn cầu dự kiến tăng 8%, với hơn 20% máy chủ triển khai trên toàn cầu dự kiến sẽ được tăng tốc.
- Đáng chú ý, đến năm 2028, 4 nhà cung cấp dịch vụ đám mây hàng đầu của Mỹ - Amazon, Google, Meta và Microsoft - dự kiến sẽ chiếm một nửa chi tiêu vốn trung tâm dữ liệu toàn cầu.
- Điều này nhấn mạnh vai trò quan trọng của các công ty công nghệ lớn trong việc định hình xu hướng đầu tư trung tâm dữ liệu.
- Những thông tin này cho thấy tầm quan trọng ngày càng tăng của các khối lượng công việc AI trong việc định hình tương lai của cơ sở hạ tầng trung tâm dữ liệu và ngành công nghệ nói chung.

📌 Báo cáo Dell'Oro dự báo chi tiêu vốn trung tâm dữ liệu siêu cấp tăng 17% vào năm 2024, nhờ đầu tư vào cơ sở hạ tầng điện toán và AI. Doanh thu máy chủ và lưu trữ tăng 18%, với xu hướng chuyển sang máy chủ tối ưu AI. Đến 2028, 4 ông lớn công nghệ Mỹ chiếm 50% chi tiêu, cho thấy vai trò then chốt của AI trong định hình tương lai ngành.

https://analyticsindiamag.com/ai-infrastructure-momentum-to-drive-data-center-capex-by-17-in-2024-report/

Không có file đính kèm.

Nguồn tham khảo

119

AI chips-hardware-compute Semi-Cloud-DC-Green 2024-03-14 02:40:14

Toppan Holdings bùng nổ đầu tư 60 tỷ yên vào AI và bán dẫn, mở rộng vươn tầm quốc tế

- Toppan Holdings của Nhật Bản dự định đầu tư khoảng 60 tỷ yên (tương đương 400 triệu USD) trong vòng ba năm vào lĩnh vực điện tử, nhằm khai thác cơ hội tăng trưởng do AI trong ngành công nghiệp bán dẫn.
- Khoản đầu tư này tăng 10 tỷ yên so với kỳ ba năm trước, chiếm 30% kế hoạch đầu tư tăng trưởng của Toppan cho giai đoạn tài chính 2023-2025.
- Mục tiêu của Toppan là tăng gấp đôi công suất sản xuất cho substrates FC-BGA dùng trong đóng gói chip so với mức của năm tài chính 2022.
- Nhu cầu về substrates được duy trì ổn định nhờ sự xuất hiện của chip cho ứng dụng AI tạo sinh.
- Toppan sản xuất substrates FC-BGA tại nhà máy ở tỉnh Niigata, trung tâm Nhật Bản, nhưng cũng có kế hoạch "hợp tác với khách hàng và đầu tư ở nước ngoài".
- Công ty cũng sẽ tăng cường đầu tư vào photomasks, được sử dụng để tạo mẫu mạch trên wafer bán dẫn.
- Toppan đã đổi tên từ Toppan Printing thành Toppan Holdings từ ngày 1 tháng 10 và chuyển sang cấu trúc công ty holding, phản ánh nỗ lực vượt ra khỏi lĩnh vực in ấn truyền thống và tăng cường hợp tác giữa các bộ phận của mình.
- Toppan sẽ dành 40% khoản đầu tư tăng trưởng cho phân khúc sống và công nghiệp, bao gồm vật liệu đóng gói, và 30% cho kinh doanh thông tin và truyền thông, bao gồm thẻ thông minh và hộ chiếu.

📌 Toppan Holdings của Nhật Bản cam kết đầu tư 60 tỷ yên vào lĩnh vực điện tử, nhấn mạnh vào việc mở rộng sản xuất substrates FC-BGA cho chip, và tăng cường đầu tư vào photomasks. Điều này không chỉ thể hiện sự chuyển mình từ in ấn truyền thống sang công nghệ cao mà còn cho thấy kế hoạch mở rộng quốc tế và tận dụng cơ hội từ AI.

https://asia.nikkei.com/Business/Companies/Japan-s-Toppan-eyes-AI-with-400m-in-chip-electronics-investment

Không có file đính kèm.

Nguồn tham khảo

129

AI chips-hardware-compute 2024-03-13 17:02:54

Các nhà nghiên cứu Anh tìm cách giảm chi phí tính toán AI xuống 1.000 lần

- Cơ quan Nghiên cứu và Sáng chế Tiên tiến (Aria) của Anh đã khởi động chương trình trị giá 42 triệu bảng có tên Scaling Compute, nhằm tìm kiếm các giải pháp thay thế rẻ hơn và tiết kiệm năng lượng hơn cho cơ sở hạ tầng kỹ thuật số dựa trên silicon đắt đỏ mà AI đang chạy hiện nay.

- Mục tiêu là giảm chi phí xuống hơn 1.000 lần so với các tiêu chuẩn ngành. Nếu thành công, chương trình này sẽ vượt xa giới hạn hiện tại về năng lực và hiệu quả tính toán, mở đường cho AI an toàn và có tính chuyển đổi toàn cầu.

- Chính phủ Anh đã phân bổ 800 triệu bảng cho Aria để đầu tư vào các dự án đột phá tiềm năng mà các cơ quan nghiên cứu công khác không tài trợ. 8 giám đốc chương trình của Aria sẽ đóng vai trò then chốt trong việc quyết định cách chi tiêu số tiền này.

- Suraj Bramhavar, người từng là Giám đốc Công nghệ tại Sync Computing (một công ty khởi nghiệp từ MIT), sẽ điều hành dự án AI này. Sáng kiến nghiên cứu sẽ tìm cách học hỏi từ cách tính toán của tự nhiên, đặc biệt là bộ não con người, vượt ra ngoài các hoạt động kỹ thuật số, kết hợp bộ nhớ và tính toán.

- Aria sẽ xem xét các đề xuất dựa trên bất kỳ loại phần cứng nào, có thể bao gồm sử dụng tốt hơn silicon hoặc các chất bán dẫn khác, cũng như chạy AI trên vật liệu sinh học. Các nhà nghiên cứu từ nhiều lĩnh vực, khu vực và tổ chức khác nhau sẽ được mời nộp đơn xin tài trợ.

- Tomas Lazauskas từ Viện Alan Turing cho rằng cách tiếp cận thách thức các mô hình tính toán truyền thống của chương trình Aria sẽ mở ra kỷ nguyên phát triển AI mới, bền vững về kinh tế và môi trường, giúp nghiên cứu AI trở nên dễ tiếp cận hơn.

📌 Aria đã khởi động chương trình 42 triệu bảng nhằm giảm chi phí tính toán AI xuống hơn 1.000 lần bằng cách tìm kiếm các giải pháp thay thế rẻ hơn và tiết kiệm năng lượng hơn cho cơ sở hạ tầng kỹ thuật số. Chương trình sẽ học hỏi từ cách tính toán của tự nhiên và bộ não con người, xem xét các đề xuất dựa trên nhiều loại phần cứng khác nhau. Mục tiêu là giúp nghiên cứu AI trở nên dễ tiếp cận và bền vững hơn.

https://www.ft.com/content/ba0a5ba0-980a-472f-a8d1-77f2602060f2

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2024-03-13 16:58:21

Startup AI Cerebras ra mắt WSE-3, chip lớn nhất cho AI tạo sinh, vượt trội so với GPU H100 của Nvidia

- Startup AI Cerebras ra mắt WSE-3, chip lớn nhất từ trước đến nay cho AI tạo sinh. Chip có kích thước bằng một tấm bán dẫn wafer, tăng gấp đôi hiệu năng để xử lý các mô hình ngôn ngữ lớn với hàng chục nghìn tỷ tham số.

- WSE-3 tăng gấp đôi tốc độ thực hiện lệnh, từ 62,5 petaFLOPS lên 125 petaFLOPS. Nó thu nhỏ bóng bán dẫn từ 7nm xuống 5nm, tăng số lượng bóng bán dẫn từ 2,6 nghìn tỷ trong WSE-2 lên 4 nghìn tỷ.

- WSE-3 có kích thước gấp 57 lần GPU H100 của Nvidia, có 52 lần số lõi, 800 lần bộ nhớ trên chip, băng thông bộ nhớ gấp 7.000 lần và băng thông fabric gấp hơn 3.700 lần.

- Máy tính CS-3 của Cerebras với WSE-3 có thể xử lý mô hình ngôn ngữ lớn lý thuyết 24 nghìn tỷ tham số, gấp 10 lần các công cụ AI tạo sinh hàng đầu như GPT-4 của OpenAI.

- Một cụm 2.048 CS-3 có thể huấn luyện mô hình ngôn ngữ lớn Llama 2 70 tỷ tham số của Meta nhanh hơn 30 lần so với cụm huấn luyện AI của Meta: 1 ngày so với 30 ngày.

- Cerebras hợp tác với Qualcomm để sử dụng bộ xử lý AI 100 cho quá trình suy luận (inference), áp dụng 4 kỹ thuật để giảm chi phí suy luận như loại bỏ 80% tính toán không cần thiết, sử dụng phiên bản nhỏ hơn của mô hình để dự đoán và phiên bản lớn hơn để kiểm tra, chuyển đổi đầu ra thành MX6 chỉ cần một nửa bộ nhớ, chọn tập hợp con các tham số để biên dịch và chạy trên AI 100.

- Thị trường suy luận được dự kiến sẽ trở thành trọng tâm của cuộc chạy đua vũ trang trong AI khi suy luận chuyển từ trung tâm dữ liệu ra các thiết bị biên (edge) như máy chủ doanh nghiệp và thiết bị di động.

📌 Chip WSE-3 mới của Cerebras tăng gấp đôi hiệu năng lên 125 petaFLOPS, có 4 nghìn tỷ bóng bán dẫn, vượt trội so với GPU H100 của Nvidia. Nó có thể xử lý mô hình ngôn ngữ 24 nghìn tỷ tham số và huấn luyện Llama 2 nhanh hơn 30 lần so với Meta. Cerebras cũng hợp tác với Qualcomm để tối ưu hóa quá trình suy luận trên chip AI 100, hướng tới thị trường thiết bị biên đang phát triển.

Citations:
[1]https://www.zdnet.com/article/ai-startup-cerebras-unveils-the-largest-chip-yet-for-generative-ai/

Không có file đính kèm.

Nguồn tham khảo

140

AI chips-hardware-compute AI skill-talent 2024-03-13 10:38:50

CEO Perplexity chia sẻ ứng viên từ Meta yêu cầu 10.000 GPU H100 mới chịu nhảy việc

- Aravind Srinivas, CEO của Perplexity, chia sẻ về khó khăn trong việc tuyển dụng một nhà nghiên cứu cấp cao từ Meta. Ứng viên yêu cầu công ty phải có 10.000 GPU H100 mới quay lại.
- Việc có được 10.000 GPU H100 từ Nvidia có thể tốn hàng tỷ USD và mất 5-10 năm.
- Perplexity gặp khó khăn trong việc tìm kiếm nhân tài để tạo ra mô hình ngôn ngữ lớn do nguồn lực hạn chế và tình trạng thiếu chip.
- Ngay cả khi các công ty nhỏ hơn có được chip của Nvidia, họ vẫn sẽ bị tụt lại phía sau do tốc độ phát triển nhanh của AI.
- Kể từ khi ChatGPT ra mắt vào tháng 11/2022, nhu cầu về kỹ năng AI như machine learning và kỹ thuật dữ liệu tăng nhanh. Các công ty công nghệ lớn đã đưa ra mức lương lên tới 900.000 USD/năm để thu hút nhân tài AI.
- Srinivas cho rằng ngoài khả năng tạo ra mô hình AI, kỹ năng hậu huấn luyện như giảm thiểu sai sót trong chatbot cũng rất quan trọng và có thể giúp các công ty AI như Perplexity nổi bật.

📌 Tuyển dụng nhân tài AI đang trở nên khó khăn hơn bao giờ hết. CEO Perplexity chia sẻ ứng viên từ Meta yêu cầu 10.000 GPU H100 trị giá hàng tỷ USD mới chịu nhảy việc. Bên cạnh khả năng tạo mô hình AI, kỹ năng hậu huấn luyện cũng đóng vai trò then chốt giúp các công ty nhỏ cạnh tranh trong cuộc đua AI đang phát triển như vũ bão.

https://www.businessinsider.com/recruiting-ai-talent-ruthless-right-now-ai-ceo-2024-3

Không có file đính kèm.

Nguồn tham khảo

167

AI chips-hardware-compute 2024-03-12 18:11:34

Chuyên gia AI đổ xô sang AMD Instinct MI300X, NVIDIA lung lay trước làn sóng chuyển dịch

- Cuộc khảo sát độc lập với 82 kỹ sư và chuyên gia AI cho thấy 50% tự tin sử dụng GPU AMD Instinct MI300X.
- Lý do: tỷ lệ hiệu năng trên giá tốt hơn, sẵn có nhiều hơn so với đối thủ như NVIDIA H100.
- TensorWave, công ty đồng sáng lập bởi Jeff Tatarchuk, sẽ sử dụng bộ tăng tốc AI MI300X.
- MI300X được thiết kế trên kiến trúc CDNA 3, kết hợp IP 5nm và 6nm, mang lại 153 tỷ bóng bán dẫn.
- MI300X có dung lượng HBM3 cao hơn 50% so với tiền nhiệm MI250X (128 GB).
- So với NVIDIA H100, MI300X có dung lượng bộ nhớ cao hơn 2.4 lần, băng thông bộ nhớ cao hơn 1.6 lần, TFLOPS FP8 và FP16 cao hơn 1.3 lần.
- Trong các bài kiểm tra 1v1 và 8v8, MI300X nhanh hơn H100 từ 20% đến 60% tùy mô hình AI.
- Thời điểm ra mắt của MI300X rất tốt khi NVIDIA đang bị kìm hãm bởi lượng đơn hàng tồn đọng.

📌 AMD Instinct MI300X đang thu hút sự quan tâm lớn từ các chuyên gia AI với hiệu năng vượt trội hơn 20-60% so với NVIDIA H100, dung lượng bộ nhớ HBM3 128 GB cùng mức giá cạnh tranh. Cuộc khảo sát cho thấy 50% chuyên gia đang cân nhắc chuyển sang MI300X, báo hiệu cơ hội cho AMD trong cuộc đua AI đang nóng lên từng ngày.

https://wccftech.com/survey-reveals-ai-professionals-switching-nvidia-to-amd-instinct-mi300x-performance-cost/

Không có file đính kèm.

Nguồn tham khảo

156

AI chips-hardware-compute 2024-03-12 17:49:16

Intel Gaudi 2 nhanh hơn NVIDIA H100 trong huấn luyện Stable Diffusion 3 của Stability AI

- Stability AI so sánh tốc độ huấn luyện mô hình tạo ảnh Stable Diffusion 3 giữa Intel Gaudi 2 và NVIDIA H100/A100.
- Trên cấu hình 2 node, Intel Gaudi 2 xử lý 927 ảnh/giây, nhanh hơn 1.5 lần so với NVIDIA H100-80GB. Tăng batch size lên 32, Gaudi 2 đạt 1.254 ảnh/giây.
- Trên 32 node, cụm Gaudi 2 xử lý hơn 3 lần ảnh/giây so với NVIDIA A100-80GB, dù A100 đã được tối ưu phần mềm.
- Trong suy luận mô hình 8B Stable Diffusion 3, Gaudi 2 có tốc độ tương đương A100 khi dùng PyTorch. Tuy nhiên với TensorRT, A100 nhanh hơn Gaudi 2 40%.
- AMD trước đó cũng tuyên bố vượt NVIDIA H100 nhưng bị NVIDIA bác bỏ do không dùng TensorRT.
- Mô hình ngôn ngữ Stable Beluga 2.5 70B cho thấy hiệu năng ấn tượng trên 256 Gaudi 2, đạt 116.777 token/giây.
- Trong suy luận mô hình 70B, Gaudi 2 nhanh hơn 28% so với A100, đạt 673 token/giây trên mỗi chip.

📌 Intel Gaudi 2 thể hiện hiệu năng vượt trội so với NVIDIA H100 và A100 trong huấn luyện và suy luận các mô hình Stable Diffusion 3 và Stable Beluga 2.5 70B của Stability AI khi không sử dụng tối ưu hóa TensorRT. Tuy nhiên, NVIDIA A100 vẫn nhanh hơn 40% khi có TensorRT. Cuộc đua AI giữa Intel, NVIDIA và AMD hứa hẹn sẽ ngày càng gay cấn trong tương lai.

https://analyticsindiamag.com/stability-ai-claims-intel-gaudi-2-is-faster-than-nvidia-h100/

Không có file đính kèm.

Nguồn tham khảo

124

AI chips-hardware-compute 2024-03-11 17:05:57

Jensen Huang: Đối thủ không thể đánh bại GPU Nvidia ngay cả khi tặng chip AI miễn phí

- Jensen Huang khẳng định GPU của Nvidia vượt trội đến mức ngay cả khi đối thủ cung cấp chip AI miễn phí, họ cũng không thể cạnh tranh được.
- Giá GPU của Nvidia không đáng kể trong tổng chi phí sở hữu (TCO) của trung tâm dữ liệu AI.
- Nvidia đã trở thành công ty có giá trị thứ 3 thế giới nhờ GPU tăng tốc AI.
- Huang cho rằng Nvidia đối mặt với nhiều đối thủ cạnh tranh nhất, kể cả khách hàng của chính họ.
- GPU của Nvidia có thể lập trình linh hoạt, trong khi chip đối thủ chỉ tốt cho một thuật toán cụ thể.
- Nền tảng Nvidia là tiêu chuẩn trong mọi công ty điện toán đám mây.
- Trung tâm dữ liệu hỗ trợ đa dạng khách hàng sẽ ưu tiên phần cứng Nvidia.
- Huang nhấn mạnh lợi thế của Nvidia về thời gian triển khai, hiệu suất, tính linh hoạt và tận dụng tài nguyên.

📌 Jensen Huang tự tin khẳng định GPU của Nvidia vượt trội tuyệt đối so với đối thủ, đến mức ngay cả chip AI miễn phí cũng không thể cạnh tranh được về tổng chi phí sở hữu. Với vị thế tiêu chuẩn trong điện toán đám mây, khả năng lập trình linh hoạt và nhiều lợi thế khác, Nvidia đang thống trị thị trường AI bất chấp sự cạnh tranh gay gắt từ nhiều đối thủ.

https://www.tomshardware.com/pc-components/gpus/jensen-huang-says-even-free-ai-chips-from-his-competitors-cant-beat-nvidias-gpus

Không có file đính kèm.

Nguồn tham khảo

142

AI chips-hardware-compute 2024-03-10 05:51:19

Tại sao AI cần một kiến trúc chip mới

- Thị trường chip AI toàn cầu dự kiến đạt 263,6 tỷ USD vào năm 2031. Chip AI được sử dụng chủ yếu ở các thiết bị biên và trung tâm dữ liệu.

- Khác với các tác vụ truyền thống, AI đòi hỏi sức mạnh tính toán ở quy mô chưa từng có. Điều này dẫn đến sự phát triển của các kiến trúc chuyên biệt để xử lý hiệu quả các yêu cầu tính toán chuyên sâu của thuật toán AI.

- AI đòi hỏi tính song song lớn của các hàm nhân-tích lũy. Do đó, kiến trúc chip phải được trang bị các bộ xử lý phù hợp và mảng bộ nhớ để xử lý hiệu quả tính song song này.

- AI phải xử lý một lượng dữ liệu khổng lồ. Di chuyển dữ liệu này một cách hiệu quả là rất quan trọng để xử lý AI nhanh và chính xác.

- Để đạt được hiệu suất suy luận như con người với mạng nơ-ron đòi hỏi sự gia tăng theo cấp số nhân về độ phức tạp của mô hình AI và thông lượng tính toán.

- Các lĩnh vực đòi hỏi hiệu suất cao hơn sẽ sử dụng nhiều hơn kiến trúc chip AI. Khi chip AI trở nên rẻ hơn, chúng ta sẽ bắt đầu thấy kiến trúc chip AI ở những nơi như IoT.

- Các lĩnh vực đầy hứa hẹn để khám phá kiến trúc chip AI mới bao gồm: Bộ xử lý chuyên biệt, phân cấp bộ nhớ, kiến trúc đa die.

📌 Sự phát triển của AI đòi hỏi một sự thay đổi căn bản trong kiến trúc chip để đáp ứng nhu cầu chưa từng có của khối lượng công việc AI. Các kiến trúc chip truyền thống cần được chuyển đổi thành các đơn vị xử lý AI bằng cách giải quyết toàn diện các yêu cầu riêng biệt của AI như tính song song lớn, yêu cầu bộ nhớ cao và hiệu suất suy luận.

Citations:
[1] https://techovedas.com/why-ai-needs-a-new-chip-architecture/

Không có file đính kèm.

Nguồn tham khảo

115

AI chips-hardware-compute 2024-03-09 21:11:58

Chip AI Hàn Quốc tiêu thụ năng lượng thấp hơn Nvidia 625 lần, nhỏ hơn 41 lần

- Nhóm nghiên cứu từ Viện Khoa học và Công nghệ tiên tiến Hàn Quốc (KAIST) giới thiệu chip AI "Complementary-Transformer" (C-Transformer) tại Hội nghị Mạch tích hợp trạng thái rắn Quốc tế 2024.
- Chip C-Transformer được tuyên bố là chip tăng tốc AI siêu tiết kiệm năng lượng đầu tiên có khả năng xử lý mô hình ngôn ngữ lớn (LLM).
- Chip này tiêu thụ năng lượng thấp hơn 625 lần và nhỏ hơn 41 lần so với GPU Nvidia A100 Tensor Core.
- Thành tựu của chip C-Transformer chủ yếu đến từ công nghệ tính toán nơ-ron tinh chỉnh.
- Chip C-Transformer hiện được sản xuất trên quy trình 28nm của Samsung, có diện tích die 20.25mm2, tần số tối đa 200 MHz, tiêu thụ dưới 500mW và đạt 3.41 TOPS.
- Kiến trúc của chip gồm 3 khối tính năng chính: HDSC với HMAU, OSSU và IWGU với ESC.
- Công nghệ tính toán nơ-ron được cải tiến để đạt độ chính xác tương đương với mạng nơ-ron sâu (DNN).
- Mặc dù chưa có so sánh trực tiếp về hiệu năng, chip C-Transformer hứa hẹn là lựa chọn hấp dẫn cho điện toán di động.

📌 Chip AI C-Transformer của KAIST tiêu thụ năng lượng thấp hơn 625 lần và nhỏ gọn hơn 41 lần so với GPU Nvidia A100, đạt 3.41 TOPS trên quy trình 28nm của Samsung. Với công nghệ tính toán nơ-ron tinh chỉnh, chip này mở ra tiềm năng ứng dụng AI trên thiết bị di động mặc dù chưa có so sánh trực tiếp về hiệu năng.

https://www.tomshardware.com/tech-industry/artificial-intelligence/korean-researchers-power-shame-nvidia-with-new-neural-ai-chip-claim-625-times-less-power-41-times-smaller

Không có file đính kèm.

Nguồn tham khảo

107

AI chips-hardware-compute 2024-03-09 21:06:43

Trừ khi bạn là Nvidia, kinh doanh chip AI là phức tạp

- Giá trị thị trường của Broadcom đã tăng hơn gấp đôi trong năm qua nhờ nhu cầu chip AI tăng vọt. Doanh thu từ chip AI đạt 2.3 tỷ USD trong quý 1/2024, tăng 53% so với quý trước. Broadcom kỳ vọng doanh thu AI vượt 10 tỷ USD trong năm tài chính hiện tại.
- Tuy nhiên, không như Nvidia, Broadcom là một gã khổng lồ công nghệ đa dạng với các mảng kinh doanh chip và phần mềm khác nhau. Mảng không dây, cung cấp chip RF cho iPhone, giảm 4% so với cùng kỳ. Các mảng khác như lưu trữ máy chủ và kết nối băng thông rộng còn tệ hơn.
- Marvell cũng cho thấy động thái tương tự, với các mảng không phải AI không đạt kỳ vọng của Wall Street. Marvell đưa ra dự báo doanh thu đáng thất vọng cho quý hiện tại do nhu cầu yếu ở mảng tiêu dùng, hạ tầng nhà mạng và mạng doanh nghiệp.
- Ngành chip đang hưởng lợi từ quan niệm rằng nó là ngành đầu tiên chứng kiến doanh thu đáng kể từ AI tạo sinh. Chỉ số PHLX tăng 65% giá trị năm ngoái, mức tăng hàng năm tốt nhất kể từ 2009, và đã tăng thêm 24% trong năm nay.
- Tuy nhiên, hầu hết các công ty chip cũng phải đối mặt với các phân khúc thị trường khác đang phát triển chậm hoặc vẫn đang vật lộn với tồn kho dư thừa do đặt hàng quá mức trước đó. Ngay cả AMD cũng phải đối mặt với thị trường PC và console chậm lại.

📌 Broadcom và Marvell đang hưởng lợi lớn từ cơn sốt chip AI với doanh thu tăng vọt, nhưng các mảng kinh doanh khác vẫn đang gặp khó khăn. Với danh mục đa dạng gồm cả phần cứng và phần mềm, Broadcom có thể đối phó tốt hơn với chu kỳ ngành chip. Tuy nhiên, cơn sốt AI sẽ không kéo dài mãi mãi.

https://www.wsj.com/business/telecom/unless-youre-nvidia-the-ai-chip-business-is-complicated-833c2275

Không có file đính kèm.

Nguồn tham khảo

124

AI chips-hardware-compute 2024-03-08 15:59:34

encharge ai tạo ra chip analog số đột phá, giảm 90% năng lượng cho ai tạo sinh

• Chip mới của EnCharge AI kết hợp tính toán analog và số, sử dụng mạch analog tiết kiệm năng lượng cho các phép tính nặng nhất của AI tạo sinh.
• Công ty nhận được khoản tài trợ 18,6 triệu USD từ DARPA để phát triển công nghệ mới, giúp triển khai AI tạo sinh trên thiết bị di động năng lượng hạn chế.
• Mô hình AI lớn như ChatGPT, Llama cần hàng kilowatt điện năng để chạy trên đám mây, nhưng chip mới chỉ tiêu thụ 10% so với hiện nay.
• Công nghệ mới sử dụng mạch analog cho phép tính accumulate - phép tính nặng nhất của AI tạo sinh, tiết kiệm 90% năng lượng so với mạch số truyền thống.
• Đây là bước đột phá quan trọng để đưa AI tạo sinh ra khỏi trung tâm dữ liệu, tới các thiết bị di động, xe tự lái, robot trong tương lai.

📌 Chip analog số đột phá của EnCharge AI giảm 90% năng lượng cho AI tạo sinh, mở đường triển khai rộng rãi công nghệ trên thiết bị di động năm 2024.

https://www.zdnet.com/article/making-genai-more-efficient-with-a-new-kind-of-chip/

Không có file đính kèm.

Nguồn tham khảo

129

AI chips-hardware-compute 2024-03-07 21:34:19

AMD phản pháo Nvidia và chi tiết cách chạy chatbot AI cục bộ trên Radeon và Ryzen

• AMD công bố hướng dẫn cho phép người dùng tương tác với chatbot AI chạy trên phần cứng cục bộ, không cần qua đám mây.
• Yêu cầu phần cứng bao gồm chip Ryzen AI hoặc GPU RX 7000-series, với Ryzen 5 8600G được hỗ trợ nhưng Ryzen 5 8500G có thể không tương thích.
• Người dùng cần tải và cài đặt LM Studio, có phiên bản ROCm cho người dùng RX 7000-series, hỗ trợ cả CPU Intel và GPU Nvidia.
• AMD khuyến nghị sử dụng mô hình "Q4 K M" cho Llama 2 7B, tối ưu hóa cho chat, với người dùng GPU RX 7000-series cần kích hoạt GPU offloading.
• Nvidia đã ra mắt ứng dụng Chat with RTX, chạy trên GPU Nvidia và hỗ trợ phân tích tài liệu, video. Intel thì chưa có ứng dụng chatbot AI riêng nhưng đã thể hiện cách sử dụng Python để tạo chatbot.
• AMD có thể sẽ phát triển phiên bản Chat with RTX của riêng mình hoặc làm việc với LM Studio để mở rộng tính năng cho phần cứng AMD, có thể tích hợp AI vào bộ điều khiển Radeon Adrenalin.

📌 AMD giới thiệu phương pháp chính thức và dễ sử dụng để chạy chatbot AI trên phần cứng của AMD, Intel và Nvidia, với hướng dẫn chi tiết cho người dùng Ryzen và Radeon. Điều này không chỉ mở ra khả năng tương tác AI mà còn cho thấy AMD đang tiến gần hơn đến việc cung cấp giải pháp toàn diện cho AI trên phần cứng của mình, có thể sẽ cạnh tranh trực tiếp với Nvidia và Intel trong tương lai.

https://www.tomshardware.com/tech-industry/artificial-intelligence/amd-fires-back-at-nvidia-with-instructions-on-running-a-local-ai-chatbot-recommends-using-a-third-party-app

Không có file đính kèm.

Nguồn tham khảo

112

AI chips-hardware-compute 2024-03-07 10:43:57

Mỹ dành 30 tỷ đô la hỗ trợ sản xuất chip bán dẫn tiên tiến, nhưng việc phân bổ nguồn lực cho TSMC và Intel để phát triển chip AI vẫn còn nhiều bất định

- Các quan chức Mỹ đã dành gần 30 tỷ đô la cho việc hỗ trợ sản xuất bán dẫn tiên tiến, nhằm mục tiêu phát triển và sản xuất chip trí tuệ nhân tạo (AI) hàng đầu ngay tại nước Mỹ.
- Với việc tiền hỗ trợ sắp được phân bổ trong vài tuần tới, việc đạt được mục tiêu này vẫn còn nhiều bất định, theo các chuyên gia trong ngành.
- Chính quyền Biden cần cân nhắc việc phân bổ tiền của người nộp thuế cho Taiwan Semiconductor Manufacturing (TSMC), một công ty hàng đầu thế giới, và Intel, một công ty nội địa đang trong quá trình cố gắng phục hồi.
- Việc đặt cược vào chip AI đặc biệt khó khăn trong ngành công nghiệp đang phát triển nhanh chóng. Việc cung cấp hỗ trợ tài chính cho Intel, TSMC hoặc Samsung Electronics không đảm bảo an ninh trong lĩnh vực AI của tương lai.
- Tiền sẽ đến từ Đạo luật CHIPS của Mỹ, được thông qua vào năm 2022. Intel, TSMC và Samsung đều đang xây dựng nhà máy tại Mỹ và có khả năng sẽ nhận được một số hỗ trợ tài chính từ Mỹ.
- Bộ Thương mại Mỹ từ chối bình luận về vấn đề này.
- TSMC, nhà lãnh đạo toàn cầu trong việc sản xuất chip AI, chưa cam kết đưa công nghệ tiên tiến nhất của mình đến Hoa Kỳ. Công ty này không dự kiến sẽ đưa sản xuất 3-nanometer, đã được sử dụng để sản xuất chip cho iPhone 15 Pro, đến Arizona cho đến ít nhất là năm 2027 hoặc 2028.

📌 Các quan chức Mỹ đang đối mặt với thách thức lớn trong việc phân bổ gần 30 tỷ đô la hỗ trợ cho sản xuất chip bán dẫn tiên tiến, với mục tiêu phát triển và sản xuất chip AI hàng đầu tại Mỹ. Sự bất định về việc đạt được mục tiêu này là do sự phát triển nhanh chóng của ngành AI và quyết định phân bổ nguồn lực cho các công ty như Intel, TSMC và Samsung. Đặc biệt, TSMC chưa cam kết đưa công nghệ sản xuất chip tiên tiến nhất của mình đến Mỹ, tạo ra thách thức cho Mỹ trong việc đảm bảo sự độc lập về công nghệ chip AI.

https://www.reuters.com/world/us/us-officials-face-tough-choices-subsidizing-ai-chip-manufacturing-2024-03-06/

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute AI market 2024-03-07 09:59:18

Huyết mạch của sự bùng nổ AI

- Trí tuệ nhân tạo (AI) đòi hỏi lượng dữ liệu và năng lượng khổng lồ để hoạt động, với các hệ thống như ChatGPT chạy trên chip silicon.
- Nhu cầu về sức mạnh tính toán để huấn luyện các chương trình AI hàng đầu đã tăng gấp đôi mỗi sáu tháng trong thập kỷ qua.
- AI có thể tiêu thụ lượng điện tương đương với quốc gia Thụy Điển vào năm 2027.
- GPT-4 của OpenAI đòi hỏi năng lượng huấn luyện cao hơn 100 lần so với GPT-3.
- Google tích hợp AI tạo sinh vào tính năng tìm kiếm, có thể làm tăng chi phí mỗi lần tìm kiếm lên gấp mười.
- Chip chạy AI và điện năng đang trong tình trạng khan hiếm, có thể sẽ không đủ năng lượng để chạy các mô hình tiên tiến mà không gây áp lực lớn lên lưới điện địa phương.
- Nvidia, công ty không mấy nổi tiếng ngoài giới game thủ máy tính cho đến khoảng một năm trước, nay trở thành công ty có giá trị thứ ba trên thế giới.
- Nvidia kiểm soát tới 95% thị trường chip AI chuyên dụng, với GPU của họ làm cho cuộc cách mạng AI hiện đại trở nên khả thi.
- Các công ty công nghệ đang đầu tư hàng chục tỷ đô la mỗi năm vào năng lực điện toán đám mây.
- Các công ty lớn như Google, Amazon và Microsoft đang đầu tư mạnh vào việc thiết kế chip máy tính tùy chỉnh của riêng họ để kiểm soát tốt hơn các doanh nghiệp AI đang phát triển của họ.

📌 Nvidia hiện đang dẫn đầu trong cuộc đua phát triển chip AI, với việc kiểm soát tới 95% thị trường chip chuyên dụng. Sự phụ thuộc vào Nvidia của các công ty công nghệ lớn đang thúc đẩy họ thiết kế chip tùy chỉnh của riêng mình để giảm chi phí và nhu cầu năng lượng, đồng thời tăng cường hiệu suất và kiểm soát đối với các sản phẩm AI của họ.

Citations:
[1] https://www.theatlantic.com/technology/archive/2024/03/nvidia-chips-gpu-generative-ai/677664/

Không có file đính kèm.

Nguồn tham khảo

121

AI chips-hardware-compute 2024-03-05 15:40:31

Chip AI sản xuất cho Trung Quốc của AMD quá mạnh

- Doanh số iPhone tại Trung Quốc giảm bất ngờ 24% trong năm nay.
- Apple đối mặt với án phạt 2 tỷ đô từ EU vì lạm dụng ứng dụng âm nhạc.
- Cựu giám đốc Twitter kiện Musk đòi 128 triệu đô tiền bồi thường.
- AMD cố gắng vượt qua rào cản thương mại do Mỹ dựng lên xung quanh Trung Quốc bằng cách phát triển chip tăng tốc AI MI309 dành riêng cho Trung Quốc, nhưng bị Bộ Thương mại từ chối không cho phép bán mà không có giấy phép.
- Nvidia đã phát hành nhiều phiên bản chip AI ít mạnh mẽ hơn tại Trung Quốc để tuân thủ kiểm soát xuất khẩu của Mỹ, trong khi AMD muốn cạnh tranh tại thị trường này.
- Bộ Thương mại Mỹ đã ngăn chặn nỗ lực của Nvidia và AMD bằng cách điều chỉnh quy tắc xuất khẩu, bao gồm cả chip dành cho Trung Quốc của Nvidia.
- Google, OpenAI, Salesforce và các công ty công nghệ khác đã ký một bức thư mở kêu gọi xây dựng trí tuệ nhân tạo có trách nhiệm, nhấn mạnh trách nhiệm chung trong việc tối đa hóa lợi ích và giảm thiểu rủi ro của AI đối với xã hội.

📌AMD cố gắng vượt qua rào cản thương mại do Mỹ dựng lên xung quanh Trung Quốc bằng cách phát triển chip tăng tốc AI MI309 dành riêng cho Trung Quốc, nhưng bị Bộ Thương mại từ chối không cho phép bán mà không có giấy phép.

https://www.bloomberg.com/news/newsletters/2024-03-05/amd-s-ai-chips-will-have-to-be-throttled-down-for-china-market

Không có file đính kèm.

Nguồn tham khảo

103

AI chips-hardware-compute 2024-03-05 07:21:32

AMD giới thiệu tính năng nâng cấp dựa trên AI, có khả năng phù hợp với DLSS

- AMD dự định giới thiệu công nghệ nâng cấp hình ảnh dựa trên AI vào năm 2024, nhằm cạnh tranh với DLSS của Nvidia và XeSS của Intel.
- CTO Mark Papermaster của AMD xác nhận công ty sẽ chuyển hướng mạnh mẽ về AI, với việc nâng cấp hình ảnh trong trò chơi là một trong những lĩnh vực tập trung.
- AMD đang phát triển phương pháp cho phép chơi game với công nghệ nâng cấp hình ảnh dựa trên AI, mặc dù chi tiết cụ thể vẫn chưa được tiết lộ.
- Trong một cuộc phỏng vấn trên podcast No Priors, Papermaster giải thích AMD đã triển khai tăng tốc AI trên toàn bộ dãy sản phẩm của mình và dự định giới thiệu các ứng dụng mới sử dụng công nghệ này trong năm nay.
- AMD FSR, công nghệ nâng cấp hình ảnh hiện tại của AMD, tránh sử dụng AI, điều này là một lợi thế và cũng là một hạn chế khi cạnh tranh với DLSS của Nvidia và XeSS của Intel.
- Papermaster nhấn mạnh AMD không thích hạn chế chức năng cho phần cứng cụ thể, vì vậy vẫn chưa rõ thiết bị nào sẽ được hỗ trợ bởi FSR dựa trên AI.

📌 Công ty AMD đang lên kế hoạch giới thiệu một bước tiến lớn trong công nghệ nâng cấp hình ảnh dựa trên AI vào năm 2024, với mục tiêu cạnh tranh trực tiếp với DLSS của Nvidia và XeSS của Intel. Công ty đã triển khai tăng tốc AI trên toàn bộ dãy sản phẩm của mình và dự định sử dụng công nghệ này trong nhiều ứng dụng mới, bao gồm cả việc nâng cấp hình ảnh trong trò chơi. Mặc dù chi tiết cụ thể về công nghệ mới này vẫn chưa được tiết lộ, nhưng sự chuyển hướng mạnh mẽ về AI của AMD cho thấy một cam kết đáng kể đối với việc cải thiện chất lượng hình ảnh và trải nghiệm chơi game cho người dùng.

Citations:
[1] https://www.techspot.com/news/102126-amd-introduce-ai-based-upscaling-potentially-matching-dlss.html

Không có file đính kèm.

Nguồn tham khảo

153

AI chips-hardware-compute AI market 2024-03-04 18:18:46

Nvidia cấm sử dụng các lớp dịch để phần mềm CUDA chạy trên các chip khác - hạn chế mới rõ ràng nhắm vào một số nhà sản xuất GPU Trung Quốc và ZLUDA

- Nvidia đã cập nhật điều khoản cấp phép của mình, cấm chạy phần mềm dựa trên CUDA trên các nền tảng phần cứng khác bằng cách sử dụng các lớp dịch.
- Hạn chế mới này dường như nhằm vào sáng kiến ZLUDA và một số nhà sản xuất GPU Trung Quốc, ngăn chặn họ sử dụng mã CUDA với các lớp dịch.
- Một kỹ sư phần mềm tên Longhorn đã phát hiện ra các điều khoản cập nhật. Một điều khoản mới trong CUDA 11.5 nêu rõ: "Bạn không được đảo ngược kỹ thuật, giải mã hoặc tháo rời bất kỳ phần nào của đầu ra được tạo ra bằng cách sử dụng các yếu tố Phần mềm với mục đích dịch đầu ra đó để nhắm mục tiêu vào nền tảng không phải của Nvidia".
- Moore Threads, một trong những nhà sản xuất GPU lớn nhất của Trung Quốc, cũng có công cụ dịch MUSIFY được thiết kế để cho phép mã CUDA hoạt động với GPU của họ. Tuy nhiên, liệu MUSIFY có thuộc về loại lớp dịch hoàn chỉnh hay không vẫn còn là một câu hỏi.
- Sử dụng các lớp dịch đe dọa đến vị thế thống trị của Nvidia trong lĩnh vực tính toán tăng tốc, đặc biệt là với các ứng dụng AI, có thể là động cơ đằng sau quyết định của Nvidia.
- Điều khoản này không có trong phát hành CUDA 11.4, vì vậy việc chạy các ứng dụng được biên dịch sử dụng trình biên dịch CUDA 11.4 và trước đó trên các bộ xử lý không phải của Nvidia bằng cách sử dụng các lớp dịch vẫn còn khả thi.

📌 Nvidia đã thực hiện một bước đi quan trọng trong việc bảo vệ công nghệ và vị thế thống trị của mình trong lĩnh vực GPU bằng cách cập nhật điều khoản cấp phép, cấm sử dụng các lớp dịch để chạy phần mềm CUDA trên các nền tảng phần cứng khác. Điều này không chỉ ảnh hưởng đến các sáng kiến như ZLUDA mà còn đến một số nhà sản xuất GPU Trung Quốc, đặc biệt là với công cụ MUSIFY của Moore Threads. Bằng cách đặt ra các hạn chế mới từ phiên bản CUDA 11.5, Nvidia đang cố gắng ngăn chặn việc sử dụng không chính thức của công nghệ của mình, đồng thời duy trì vị thế dẫn đầu trong lĩnh vực tính toán tăng tốc và ứng dụng AI.

Citations:
[1] https://www.tomshardware.com/pc-components/gpus/nvidia-bans-using-translation-layers-for-cuda-software-to-run-on-other-chips-new-restriction-apparently-targets-zluda-and-some-chinese-gpu-makers

Không có file đính kèm.

Nguồn tham khảo

130

AI chips-hardware-compute AI PC 2024-03-04 10:38:20

Nvidia muốn dân chủ hóa AI bằng GPU máy tính xách tay RTX 500, RTX 1000 mới

- GPU laptop Nvidia RTX 500 và RTX 1000 thuộc thế hệ Ada sẽ có mặt trên thị trường vào mùa xuân này, được tích hợp trong các sản phẩm của Dell, HP, Lenovo và MSI.
- RTX 4000 có thể là lựa chọn tốt hơn với giá cả phải chăng hơn và hiệu suất mạnh mẽ hơn trong một chiếc laptop tiêu chuẩn, đặc biệt khi xây dựng các mô hình LLM (Large Language Models).
- AI đang ngày càng trở nên phổ biến trong môi trường làm việc lai và các ngành nghề cần laptop kinh doanh có khả năng tăng tốc AI mạnh mẽ.
- RTX 500 và RTX 1000 được thiết kế để tối ưu hóa cho các tác vụ AI, với RTX 500 cung cấp hiệu suất AI tạo sinh lên đến 14 lần so với Stable Diffusion, chỉnh sửa ảnh nhanh hơn 3 lần và hiệu suất đồ họa 3D nhanh hơn 10 lần so với cấu hình chỉ dùng CPU.
- Các GPU mới này hứa hẹn sẽ cải thiện quy trình làm việc chuyên nghiệp, giúp các biên tập viên video loại bỏ tiếng ồn nền với AI, các nhà thiết kế đồ họa nâng cấp hình ảnh mờ với AI upscaling và nâng cao chất lượng hội nghị truyền hình và trải nghiệm streaming cho người dùng di động.

📌 Các GPU laptop Nvidia RTX 500 và RTX 1000 mới sẽ sớm ra mắt, mang lại cơ hội tiếp cận công nghệ AI mạnh mẽ cho người dùng chuyên nghiệp. RTX 500 và RTX 1000 được thiết kế để tối ưu hóa cho các tác vụ AI, với RTX 500 cung cấp hiệu suất AI tạo sinh lên đến 14 lần so với Stable Diffusion, chỉnh sửa ảnh nhanh hơn 3 lần và hiệu suất đồ họa 3D nhanh hơn 10 lần so với cấu hình chỉ dùng CPU. Tuy nhiên, RTX 4000 vẫn có thể là lựa chọn tốt hơn với mức giá cạnh tranh và hiệu suất cao trong một cấu hình laptop tiêu chuẩn.

Citations:
[1] https://www.techradar.com/pro/nvidia-wants-to-democratize-ai-with-new-rtx-500-rtx-1000-laptop-gpus-but-i-cannot-help-wonder-whether-nvidia-rtx-4000-gpus-are-a-better-choice

Không có file đính kèm.

Nguồn tham khảo

166

AI chips-hardware-compute 2024-03-03 18:13:48

Cuộc chiến công nghệ: Khả năng chip AI của Huawei bị giám sát chặt chẽ sau khi công ty dẫn đầu thị trường Nvidia khai thác nó như một đối thủ tiềm năng

- Khả năng AI chip của Huawei đang được xem xét kỹ lưỡng sau khi Nvidia coi đó là đối thủ tiềm năng.
- Chip Ascend 910B của Huawei, đã có mặt trên thị trường Trung Quốc, được cho là có khả năng tính toán tương đương với GPU A100 của Nvidia.
- Chip phát triển bởi Trung Quốc có thể cạnh tranh với A100 của Nvidia về khả năng hỗ trợ thuật toán AI, theo công ty nghiên cứu bán dẫn SemiAnalysis.
- Do Nvidia hiện không thể xuất khẩu GPU tiên tiến của mình sang Trung Quốc đại lục do hạn chế xuất khẩu của Washington, chipset AI mới từ Huawei đã xuất hiện như một sự thay thế cho sản phẩm của công ty Mỹ tại Trung Quốc.
- Huawei chưa đưa ra bình luận công khai về 910B.
- Nhiều nhà phân tích và chuyên gia ngành công nghiệp e ngại bình luận về cuộc đối đầu giữa Nvidia và Huawei, mặc dù họ chỉ ra rằng nhà thiết kế chip Mỹ có ưu thế về GPU và lợi ích từ hệ sinh thái phần mềm CUDA của mình.
- Huawei có kiến trúc tính toán riêng cho Mạng Nơ-ron, một nền tảng kết nối phần cứng và phần mềm Ascend, quan trọng để khai thác sức mạnh tính toán AI.

📌 Huawei đang đối mặt với sự xem xét kỹ lưỡng về khả năng AI chip của mình sau khi Nvidia coi công ty này là một đối thủ tiềm năng. Chip Ascend 910B của Huawei, với khả năng tính toán được cho là tương đương với GPU A100 của Nvidia, đã sẵn sàng trên thị trường Trung Quốc và được xem là một sự thay thế tiềm năng cho sản phẩm của Nvidia tại đây do hạn chế xuất khẩu của Mỹ. Tuy nhiên, để cạnh tranh với Nvidia, Huawei cần phải xây dựng một hệ sinh thái phần mềm tương đương với CUDA của Nvidia, điều này đòi hỏi những khoản đầu tư lớn và sự hợp tác chặt chẽ với các đối tác phần mềm.

Citations:
[1] https://www.scmp.com/tech/tech-war/article/3253943/tech-war-huaweis-ai-chip-capabilities-under-intense-scrutiny-after-market-leader-nvidia-taps-it

Không có file đính kèm.

Nguồn tham khảo

114

AI chips-hardware-compute AI market 2024-03-01 04:17:33

Qualcomm và MediaTek chạy đua để đưa AI vào các thiết bị

- Qualcomm và MediaTek đang phát triển khả năng AI tạo sinh trên các thiết bị di động, tìm kiếm ứng dụng đột phá tiếp theo.
- Durga Malladi của Qualcomm cho biết quá trình thương mại hóa AI trên thiết bị di động đang tiến triển tốt nhưng vẫn ở giai đoạn đầu.
- Qualcomm nhắm đến việc tích hợp AI tạo sinh vào nhiều loại thiết bị khác nhau, từ điện thoại thông minh, laptop đến ô tô.
- Công ty đã ra mắt thư viện 75 mô hình AI được tối ưu hóa sẵn cho việc triển khai trên các thiết bị.
- Các khách hàng của Qualcomm như Samsung Electronics, Honor, Xiaomi và Oppo đã bắt đầu tích hợp các tính năng AI vào điện thoại hàng đầu của họ.
- Qualcomm cũng đang phát triển mô hình đa phương tiện lớn (LMMs), được xem là lĩnh vực quan trọng tiếp theo trong AI sau mô hình ngôn ngữ lớn (LLMs).
- MediaTek, nhà phát triển chip di động lớn thứ hai thế giới về doanh thu, cũng trình diễn khả năng AI trên thiết bị tại MWC.
- Công ty tập trung chủ yếu vào thị trường điện thoại thông minh và đang phát triển các tính năng mới như đọc và tóm tắt tài liệu dày đặc trong vài giây.
- McKinsey & Co. dự báo AI tạo sinh có thể tạo ra lợi ích kinh tế hàng năm từ 2.6 đến 4.4 nghìn tỷ đô la.
- Các nhà phân tích nhận định rằng công nghệ mới này có thể thay đổi cục diện cạnh tranh trong lĩnh vực chip và các tính năng AI sẽ dần được áp dụng cho điện thoại tầm trung.

📌 Qualcomm và MediaTek đang tiên phong trong việc tích hợp AI tạo sinh vào thiết bị di động, mở ra hướng đi mới cho ngành công nghệ. Qualcomm đang phát triển mô hình đa phương tiện lớn (LMMs), được xem là lĩnh vực quan trọng tiếp theo trong AI sau mô hình ngôn ngữ lớn (LLMs). Với việc ra mắt thư viện mô hình AI và các tính năng AI trên điện thoại hàng đầu, Qualcomm không chỉ mở rộng ảnh hưởng của mình trong lĩnh vực smartphone mà còn trong các thiết bị khác như laptop và ô tô. MediaTek, mặc dù tập trung vào thị trường smartphone, cũng không kém cạnh với các công cụ chỉnh sửa ảnh tiên tiến và khả năng đọc và tóm tắt tài liệu dày đặc trong vài giây. Cả hai công ty đều đang nghiên cứu và phát triển các tính năng text-to-video, hứa hẹn sẽ là bước tiến lớn tiếp theo trong AI.

https://asia.nikkei.com/Business/Tech/Semiconductors/Qualcomm-and-MediaTek-race-to-put-generative-AI-on-devices

Không có file đính kèm.

Nguồn tham khảo

121

AI smartphone AI chips-hardware-compute 2024-02-29 10:24:20

Tương lai là AI 6G, Samsung giới thiệu chip DRAM 36GB đầu tiên trong ngành

- Samsung đã công bố chip DRAM 36GB, một bước tiến quan trọng trong ngành công nghiệp, hướng tới việc phát triển mạng 6G và trí tuệ nhân tạo (AI).
- Quá trình phát triển mạng di động đã trải qua nhiều thế hệ, từ 2G vào năm 1991, 3G vào năm 2001, 4G vào năm 2009, và 5G vào năm 2018. Hiện tại, sự ra đời của 6G đang được chờ đợi.
- Các chuyên gia dự đoán rằng mạng di động thế hệ thứ sáu (6G), được hỗ trợ bởi trí tuệ nhân tạo (AI), sẽ kết hợp giao tiếp và tính toán vào một thế giới liên kết mạch lạc giữa thực và ảo.
- Qin Fei, chủ tịch viện nghiên cứu truyền thông tại vivo, nhận định rằng 6G sẽ giới thiệu một internet vạn vật thông minh, thay vì chỉ là internet vạn vật như trước đây.
- 6G hứa hẹn sẽ mang lại cải thiện đáng kể về độ trễ dữ liệu, bảo mật, độ tin cậy, và khả năng xử lý tức thì lượng lớn dữ liệu trên toàn cầu, thay đổi cả lĩnh vực giải trí và công việc.

📌 Samsung đang tiên phong trong việc phát triển công nghệ cho thế hệ mạng di động tiếp theo với việc giới thiệu chip DRAM 36GB đầu tiên trong ngành. Sự phát triển này không chỉ là một bước tiến lớn trong công nghệ lưu trữ và xử lý dữ liệu mà còn là một dấu hiệu cho thấy tương lai của mạng 6G và AI đang ngày càng trở nên gần kề. Với sự hỗ trợ của AI, 6G hứa hẹn sẽ mở ra một thế giới mới với internet vạn vật thông minh, cung cấp khả năng kết nối và xử lý dữ liệu mạnh mẽ, đáp ứng nhu cầu ngày càng tăng về tốc độ và bảo mật trong truyền thông và công nghệ thông tin.

Citations:
[1] https://www.phonearena.com/news/the-future-is-ai-6g-samsung-shows-off-industry-first-36gb-dram-chip_id155802

Không có file đính kèm.

Nguồn tham khảo

146

AI chips-hardware-compute 2024-02-28 16:50:50

Groq - con chip được thiết kế để chạy các mô hình AI cực kỳ nhanh

- Groq phát triển Language Processing Unit (LPU), một loại chip mới chuyên biệt cho việc chạy các mô hình AI với tốc độ rất cao.
- GroqChip hiện tại là một bộ xử lý 14nm, hoạt động dựa trên quy mô, vận hành trong đám mây như một cụm các đơn vị được cấu trúc tốt, phân tích dữ liệu một cách hiệu quả.
- Việc có quyền truy cập vào suy luận AI với độ trễ thấp giúp giảm bớt một số điểm nghẽn trong việc cung cấp các giải pháp AI, cho phép chuyển đổi văn bản thành giọng nói và ngược lại diễn ra trong thời gian thực.
- Jonathan Ross, người sáng lập và CEO của Groq, cũng là người dẫn dắt phát triển Google's Tensor Processing Units (TPU), đã thiết kế các chip này với mục tiêu về khả năng mở rộng nhanh chóng và dòng chảy dữ liệu hiệu quả qua chip.
- Groq tập trung vào việc chạy các mô hình AI thay vì đào tạo chúng, một hướng đi khác biệt so với nhiều công ty khác đang cạnh tranh trong lĩnh vực trí tuệ nhân tạo.

📌 Groq tập trung vào việc chạy các mô hình AI thay vì đào tạo chúng, một hướng đi khác biệt so với nhiều công ty khác. GroqChip hiện tại là một bộ xử lý 14nm. Groq đang định hình lại tương lai của AI với việc phát triển Language Processing Unit (LPU), một loại chip được thiết kế đặc biệt để chạy các mô hình AI với tốc độ cao. Sự đổi mới này không chỉ giúp giảm thiểu độ trễ trong suy luận AI, mà còn mở ra khả năng tương tác tự nhiên hơn với trợ lý AI, như việc chuyển đổi văn bản thành giọng nói và ngược lại một cách nhanh chóng. Với kinh nghiệm từ việc phát triển Google's Tensor Processing Units (TPU), Jonathan Ross và đội ngũ của mình tại Groq đang tập trung vào việc mở rộng quy mô và tối ưu hóa dòng chảy dữ liệu qua chip.

Citations:
[1] https://www.tomsguide.com/ai/meet-groq-the-chip-designed-to-run-ai-models-really-really-fast

Không có file đính kèm.

Nguồn tham khảo

174

AI chips-hardware-compute 2024-02-27 21:56:47

'Chạy các mô hình AI với giá chỉ 5.000 USD': công ty khởi nghiệp CPU may mắn tuyên bố tiết kiệm 99% chi phí AI

- Tachyum, một startup về CPU, đã từng tuyên bố rằng một đơn vị Prodigy Universal Processor của họ có thể sánh ngang hàng với hàng chục GPU Nvidia H200.
- Bộ vi xử lý 192 lõi, 5nm của họ cung cấp hiệu suất cao gấp 4.5 lần so với các bộ vi xử lý tốt nhất cho tải công việc đám mây và được cho là hiệu quả hơn 6 lần so với GPU cho AI.
- Công ty giờ đây đã công bố nền tảng Prodigy ATX, một trạm làm việc AI với giá chỉ 5.000 đô la, hứa hẹn khả năng chạy mô hình AI tiên tiến.
- Hệ thống này có 1TB bộ nhớ, được thiết kế để làm cho các mô hình AI phức tạp trở nên dễ tiếp cận hơn với đại chúng.
- Nền tảng Prodigy ATX được xây dựng quanh một bộ vi xử lý Prodigy 96 lõi, được thiết kế với chỉ một nửa số lõi được kích hoạt để giảm tiêu thụ năng lượng và tăng hiệu suất, giúp giảm chi phí và làm cho nền tảng dễ tiếp cận hơn.
- Hệ thống dự kiến sẽ được trang bị 1TB DDR5-6400 SDRAM với 16 mô-đun bộ nhớ, cung cấp băng thông tối đa là 819.2 GB/s.
- Mặc dù có thông số kỹ thuật ấn tượng, nhưng vẫn có nghi ngờ về khả năng kinh tế của nền tảng Prodigy ATX đối với Tachyum.
- CEO của Tachyum, Dr. Radoslav Danilak, vẫn lạc quan, tuyên bố rằng khả năng AI mạnh mẽ của nền tảng sẽ cho phép các tổ chức mọi quy mô cạnh tranh trong các sáng kiến AI.
- Ra mắt nền tảng Prodigy ATX đã bị trì hoãn nhiều lần, với kế hoạch mới nhất đặt ra cho việc ra mắt bộ vi xử lý vào nửa sau của năm 2024.

📌 Tachyum đang thách thức quan điểm truyền thống về chi phí và hiệu suất trong lĩnh vực AI với nền tảng Prodigy ATX của mình. Với giá chỉ 5.000 đô la và trang bị 1TB RAM, hệ thống này hứa hẹn sẽ mở ra khả năng tiếp cận các mô hình AI tiên tiến cho một lượng lớn người dùng và tổ chức, từ đó làm giảm bớt sự chênh lệch giữa các tổ chức lớn và nhỏ trong cuộc đua AI. Tuy nhiên, vẫn còn những nghi ngờ về khả năng kinh tế và thực tế của việc triển khai nền tảng này, cũng như liệu Tachyum có thể giao hàng đúng hẹn và đáp ứng các hứa hẹn về hiệu suất hay không. Ra mắt nền tảng Prodigy ATX đã bị trì hoãn nhiều lần, với kế hoạch mới nhất đặt ra cho việc ra mắt bộ vi xử lý vào nửa sau của năm 2024.

Citations:
[1] https://www.techradar.com/pro/run-ai-models-for-as-low-as-dollar5000-plucky-cpu-startup-that-claimed-99-saving-on-ai-costs-now-wants-to-sell-you-an-ai-workstation-with-an-unbelievable-price-tag-and-1tb-ram

Không có file đính kèm.

Nguồn tham khảo

141

AI chips-hardware-compute 2024-02-26 15:59:21

Nvidia ra mắt GPU máy tính xách tay RTX 500 và 1000 Ada Generation cho AI khi đang di chuyển

### SEO Contents

- Nvidia công bố GPU laptop RTX 500 và 1000 Ada Generation mới, nhằm mục đích hỗ trợ xử lý AI mọi lúc mọi nơi.
- GPU mới sử dụng kiến trúc Ada Lovelace, hướng đến việc tăng cường khả năng cho người sáng tạo nội dung, nhà nghiên cứu và kỹ sư.
- RTX 500 và 1000 Ada Generation được thiết kế để đáp ứng nhu cầu ngày càng tăng của các giải pháp di động mạnh mẽ, kết hợp hiệu suất AI và đồ họa cho các chuyên gia.
- Các GPU mới sẽ có mặt trong các trạm làm việc di động sắp tới từ các đối tác sản xuất toàn cầu như Dell Technologies, HP, Lenovo và MSI.
- RTX 500 và 1000 hứa hẹn sẽ cải thiện quy trình làm việc chuyên nghiệp, từ chỉnh sửa video với AI để giảm nhiễu, thiết kế đồ họa nâng cấp hình ảnh mờ, đến cải thiện trải nghiệm hội nghị truyền hình và phát trực tuyến chất lượng cao.
- Nvidia cũng cung cấp dòng GPU RTX 2000, 3000, 3500, 4000 và 5000 Ada Generation cho các nhu cầu từ rendering nâng cao, khoa học dữ liệu đến học sâu.
- RTX 500 và 1000 mang lại các cải tiến cho laptop mỏng và nhẹ bao gồm RT Cores thế hệ thứ ba, Tensor Cores thế hệ thứ tư, CUDA cores Ada Generation, bộ nhớ GPU chuyên dụng, công nghệ DLSS 3 và bộ mã hóa AV1.

📌 Nvidia đã chính thức giới thiệu hai GPU laptop mới là RTX 500 và RTX 1000 Ada Generation, đánh dấu bước tiến quan trọng trong việc cung cấp giải pháp AI di động. Với kiến trúc Ada Lovelace tiên tiến, những GPU này không chỉ hứa hẹn cải thiện đáng kể hiệu suất đồ họa và tính toán trong các thiết bị di động mà còn hỗ trợ đắc lực cho các quy trình làm việc chuyên nghiệp như chỉnh sửa video, thiết kế đồ họa và hội nghị truyền hình. Sự ra mắt của RTX 500 và 1000 cũng mở rộng dòng sản phẩm dựa trên kiến trúc Ada Lovelace của Nvidia, bao gồm các dòng GPU từ RTX 2000 đến RTX 5000, đáp ứng nhu cầu đa dạng từ rendering, khoa học dữ liệu đến học sâu.

Citations:
[1] https://venturebeat.com/ai/nvidia-launches-rtx-500-and-1000-ada-generation-laptop-gpus-for-ai-on-the-go/

Không có file đính kèm.

Nguồn tham khảo

114

AI chips-hardware-compute AI market 2024-02-24 22:32:34

NVIDIA GIỚI THIỆU CHIP AI MỚI NHẮM VÀO THỊ TRƯỜNG TRUNG QUỐC TRONG BỐI CẢNH HẠN CHẾ XUẤT KHẨU CỦA MỸ

NVIDIA giới thiệu hai chip AI mới dành riêng cho thị trường Trung Quốc để đối phó với hạn chế xuất khẩu của Mỹ.

Các chip mới được thiết kế để tuân thủ chính sách xuất khẩu của Mỹ nhưng vẫn đáp ứng nhu cầu của khách hàng Trung Quốc.

NVIDIA nhằm mục tiêu giữ vững vị thế trong thị trường cạnh tranh, đặc biệt sau khi lệnh cấm xuất khẩu ảnh hưởng đến triển vọng kinh doanh tại khu vực này.

CEO NVIDIA, Jensen Huang, dẫn dắt sáng kiến thúc đẩy đổi mới và phát triển giải pháp phù hợp với nhu cầu địa phương.

Các chip AI mới kỳ vọng cung cấp hiệu suất và hiệu quả tăng cường cho nhiều ứng dụng từ y tế, tài chính đến lái xe tự động.

📌 NVIDIA đã thực hiện một bước đi quan trọng để thích ứng với những hạn chế xuất khẩu từ Mỹ bằng cách giới thiệu hai chip AI mới cho thị trường Trung Quốc. Điều này không chỉ cho thấy sự linh hoạt và khả năng đổi mới của NVIDIA trong bối cảnh thách thức mà còn nhấn mạnh cam kết của công ty trong việc phát triển công nghệ tiên tiến phù hợp với nhu cầu và quy định địa phương. Các chip mới được kỳ vọng sẽ mở ra cơ hội mới cho NVIDIA tại thị trường Trung Quốc, đồng thời củng cố vị thế của hãng trong ngành công nghiệp AI toàn cầu.

Không có file đính kèm.

Nguồn tham khảo

111

AI chips-hardware-compute 2024-02-23 17:04:01

Nvidia H100: Chip Trung Tâm Dữ liệu Đột Phá Thúc Đẩy Cuộc Cách Mạng AI

- Chip H100 của Nvidia, được đặt theo tên nhà khoa học máy tính Grace Hopper, là một phiên bản nâng cấp của GPU, tối ưu hóa cho việc xử lý dữ liệu và tính toán lớn, phù hợp cho việc huấn luyện mô hình AI.
- H100 nhanh hơn bốn lần so với người tiền nhiệm A100 trong việc huấn luyện mô hình ngôn ngữ lớn (LLMs) và nhanh hơn 30 lần trong việc phản hồi lệnh của người dùng.
- Nvidia, thành lập năm 1993, đã đầu tư vào thị trường này gần hai thập kỷ, nhận ra khả năng xử lý song song sẽ làm tăng giá trị của chip trong các ứng dụng ngoài gaming.
- Nvidia chiếm khoảng 80% thị trường cho bộ tăng tốc AI trong các trung tâm dữ liệu của AWS, Google Cloud và Azure. Các nỗ lực tự xây dựng chip của họ và sản phẩm cạnh tranh từ AMD và Intel chưa tạo được ấn tượng mạnh.
- Nvidia cập nhật sản phẩm của mình nhanh chóng, bao gồm cả phần mềm hỗ trợ phần cứng, và đã phát triển các hệ thống cụm giúp khách hàng mua H100s theo số lượng lớn và triển khai nhanh chóng.
- AMD và Intel đang cố gắng bắt kịp Nvidia, với AMD giới thiệu dòng Instinct và Intel phát triển chip cụ thể cho tải trọng AI, nhưng Nvidia vẫn có lợi thế với ngôn ngữ lập trình CUDA của mình.
- Nvidia dự định sẽ phát hành chip kế nhiệm H100 là H200 và sau đó là mô hình B100 với những thay đổi đáng kể về thiết kế trong tương lai.

📌 Chip H100 của Nvidia đã tạo ra một bước ngoặt lớn trong ngành công nghiệp AI, không chỉ với tốc độ xử lý nhanh chóng mà còn với việc định hình Nvidia như một công ty dẫn đầu duy nhất trong lĩnh vực này. Với doanh thu tăng 81% lên đến 22 tỷ USD trong quý cuối cùng của năm 2023, Nvidia không chỉ chứng minh được sức mạnh vượt trội của mình trong việc huấn luyện mô hình ngôn ngữ lớn mà còn trong việc duy trì vị thế dẫn đầu trước các đối thủ như AMD và Intel. Sự ra mắt của H200 và sau đó là B100 hứa hẹn sẽ tiếp tục thúc đẩy sự phát triển của công nghệ AI và củng cố vị thế của Nvidia trên thị trường.

https://www.business-standard.com/companies/news/nvidia-s-h100-data-center-chip-driving-the-ai-boom-all-you-need-to-know-124022300118_1.html

Không có file đính kèm.

Nguồn tham khảo

122

AI chips-hardware-compute 2024-02-21 21:17:55

Công cụ AI cấp độ tiếp theo đứng đầu trong cuộc đua tốc độ LLM

- Groq LPU Inference Engine đã vượt qua tất cả các đối thủ trong các bài kiểm tra công khai về tổng thời gian phản hồi, thông lượng theo thời gian, biến thiên thông lượng và độ trễ so với thông lượng.
- Công ty Groq, có trụ sở tại California, đã phát triển một loại chip mới để giải quyết các vấn đề về mật độ tính toán và băng thông bộ nhớ, nhằm tăng tốc độ xử lý các ứng dụng tính toán nặng như Mô hình Ngôn Ngữ Lớn (LLM).
- Đơn vị Xử lý Ngôn Ngữ (LPU) là một phần không thể thiếu của động cơ suy luận của công ty, xử lý thông tin và cung cấp câu trả lời cho các truy vấn từ người dùng cuối, cung cấp càng nhiều token (hoặc từ) càng tốt cho các phản hồi cực kỳ nhanh.
- Trong các thử nghiệm nội bộ vào cuối năm ngoái, Groq đã đạt được hơn 300 token mỗi giây cho mỗi người dùng thông qua Llama-2 (70B) LLM từ Meta AI.
- Vào tháng 1 năm 2024, ArtificialAnalysis.ai đã độc lập đánh giá Groq và API Llama 2 Chat (70B) của nó, đạt được thông lượng 241 token mỗi giây, gấp hơn hai lần tốc độ của các nhà cung cấp dịch vụ khác.
- Groq LPU Inference Engine được công nhận là lựa chọn nhanh nhất để chạy Mô hình Ngôn Ngữ Lớn, và công ty tự hào về việc được ArtificialAnalysis.ai công nhận là một đối thủ thực sự trong số các bộ tăng tốc AI.

📌 Groq LPU Inference Engine đã thiết lập một tiêu chuẩn mới trong lĩnh vực tốc độ xử lý mô hình ngôn ngữ lớn (LLM), với các kết quả đáng kinh ngạc như đạt được hơn 300 token mỗi giây cho mỗi người dùng và thông lượng 241 token mỗi giây trong các bài kiểm tra độc lập bởi ArtificialAnalysis.ai. Sự đổi mới trong thiết kế chip của Groq giúp giải quyết các thách thức về mật độ tính toán và băng thông bộ nhớ, mở ra khả năng xử lý nhanh chóng các truy vấn phức tạp và tăng cường hiệu suất cho các ứng dụng AI nặng. Sự công nhận từ bên thứ ba như ArtificialAnalysis.ai không chỉ khẳng định vị thế dẫn đầu của Groq trong ngành mà còn làm nổi bật tiềm năng của công nghệ này trong việc hỗ trợ các mô hình ngôn ngữ lớn, mở ra cánh cửa cho các ứng dụng mới và cải thiện đáng kể trải nghiệm người dùng cuối.

Citations:
[1] https://newatlas.com/technology/groq-lpu-inference-engine-benchmarks/

Không có file đính kèm.

Nguồn tham khảo

143

AI chips-hardware-compute 2024-02-20 16:43:42

Nỗi lo ngày càng lớn về bong bóng khổng lồ khi cuộc đua chip AI tiến triển

- Chris Miller, tác giả của "Chip War," nhận định rằng chip tốc độ cao đã trở thành "hàng hóa chiến lược" trong tình hình đối đầu địa chính trị hiện nay.
- Chính phủ Mỹ và các quốc gia khác được dự đoán sẽ rất nhạy cảm với vị trí của các nhà máy chip và những người tham gia sản xuất để tránh cho các quốc gia độc tài như Trung Quốc sử dụng AI vào mục đích xấu.
- NVIDIA dẫn đầu thị trường chứng khoán với sự tăng trưởng mạnh mẽ.
- Pedro Domingos, một chuyên gia trong lĩnh vực AI, so sánh cơn sốt đầu tư hiện nay với một "quả bóng đang được bơm phồng nhanh chóng" cho đến khi nó vỡ.
- Domingos cảnh báo rằng nhiều người, công ty, quốc gia có thể sẽ mất một lượng tiền lớn khi bong bóng vỡ, nhưng về lâu dài, AI sẽ giống như Internet - trở thành một thực tế không thể thiếu và là nền tảng cho sự tiến bộ công nghệ tiếp theo.

📌 Trong bối cảnh địa chính trị hiện nay, chip AI đang được coi là một "hàng hóa chiến lược" quan trọng, và các quốc gia đang ngày càng nhận thức rõ về điều này. Sự nhạy cảm của chính phủ Mỹ và các quốc gia khác đối với vị trí sản xuất chip và những người tham gia vào quá trình này là một phản ứng để ngăn chặn các mối đe dọa tiềm tàng từ các quốc gia như Trung Quốc. Mặc dù có những lo ngại về một bong bóng công nghệ lớn do cơn sốt đầu tư vào AI, nhưng nhìn về lâu dài, AI được dự đoán sẽ có tác động sâu rộng và tích cực tương tự như Internet, trở thành nền tảng cho những bước tiến công nghệ tiếp theo.

Citations:
[1] https://www.dw.com/en/fears-grow-of-huge-bubble-as-ai-chip-race-advances/a-68272265

Không có file đính kèm.

Nguồn tham khảo

121

AI chips-hardware-compute 2024-02-19 17:14:36

TSMC Kỳ Vọng Tăng Trưởng Mạnh Mẽ Năm 2024 Nhờ Sản Xuất Chip AI

- TSMC báo cáo hiệu suất giảm trong năm 2023 do nhu cầu chậm lại, cắt giảm đơn hàng, giảm giá, chi phí tăng và căng thẳng địa chính trị ngày càng tăng.
- Dù gặp nhiều thách thức, TSMC dự đoán doanh số bán hàng sẽ phục hồi, tăng trên 20% theo giá trị đô la trong năm nay.

📌 TSMC, một trong những công ty sản xuất chip hàng đầu thế giới, đã trải qua một năm 2023 đầy khó khăn với nhiều yếu tố tiêu cực ảnh hưởng đến hiệu suất kinh doanh như nhu cầu giảm sút, cắt giảm đơn hàng, giảm giá, chi phí sản xuất tăng và tình hình địa chính trị không ổn định. Tuy nhiên, công ty vẫn lạc quan về triển vọng trong năm 2024, với dự đoán mức tăng trưởng doanh số bán hàng lên trên 20% theo giá trị đô la, nhờ vào sự tăng trưởng của thị trường chip AI. Điều này cho thấy sự linh hoạt và khả năng thích ứng của TSMC trước những biến động của thị trường, cũng như năng lực cạnh tranh mạnh mẽ trong lĩnh vực công nghệ cao.

Citations:
[1] https://www.digitimes.com/news/a20240219PD200/tsmc-ic-manufacturing-2024-ai.html

Không có file đính kèm.

Nguồn tham khảo

123

AI market AI chips-hardware-compute 2024-02-17 21:13:08

SAM ALTMAN CỦA OPENAI ĐANG TÌM KIẾM SỰ CHẤP THUẬN CỦA HOA KỲ CHO DỰ ÁN SẢN XUẤT CHIP ĐẦY THAM VỌNG TRỊ GIÁ 7 NGHÌN TỶ USD

- Sam Altman, CEO của OpenAI, đang tìm kiếm sự chấp thuận từ chính quyền Joe Biden cho dự án sản xuất bán dẫn trị giá 7 nghìn tỷ đô la.
- Mục tiêu của dự án là biến đổi ngành công nghiệp bán dẫn toàn cầu và nâng cao khả năng phát triển và triển khai AI.
- Dự án này quan trọng trong việc tiến bộ của AI và giải quyết vấn đề thiếu hụt chip tính toán tiên tiến.
- Altman đã thảo luận với các nhà đầu tư tiềm năng và đối tác từ Mỹ, Trung Đông và Châu Á để hỗ trợ tầm nhìn của mình.
- Sự thành công của dự án phụ thuộc vào việc nhận được sự chấp thuận từ các quan chức chính phủ Mỹ.
- Các nhà sản xuất chip hàng đầu như TSMC và Samsung Electronics đã bày tỏ sự quan tâm, cho thấy tiềm năng lớn của dự án trong việc biến đổi ngành công nghiệp bán dẫn.
- Altman dự định tạo ra một công ty mới riêng biệt từ OpenAI để thông qua việc phát hành cổ phần hỗ trợ nhu cầu tài chính của dự án.
- Dự án này cũng có thể gặp phải mối quan ngại về chống độc quyền, cần phải có thêm sự chấp thuận từ các cơ quan chức năng Mỹ.
- Dự án không chỉ có ý nghĩa về mặt tài chính và công nghệ mà còn là bước đi chiến lược để đảm bảo sự phát triển liên tục của công nghệ AI bằng cách bảo đảm cơ sở hạ tầng cần thiết và ngăn chặn tình trạng thiếu hụt chip.

📌 Dự án sản xuất bán dẫn trị giá 7 nghìn tỷ đô la của Sam Altman là một bước tiến quan trọng trong việc định hình lại ngành công nghiệp AI toàn cầu. Sự chấp thuận từ chính quyền Mỹ và các cơ quan chức năng sẽ là chìa khóa để dự án có thể tiến triển, đồng thời đảm bảo rằng các vấn đề về chống độc quyền được giải quyết một cách thận trọng. Sự quan tâm từ các nhà sản xuất chip hàng đầu như TSMC và Samsung Electronics cũng là một dấu hiệu tích cực cho thấy dự án có tiềm năng lớn trong việc cải thiện cơ sở hạ tầng cần thiết cho sự phát triển của AI.

Citations:
[1] https://www.cryptopolitan.com/sam-altman-seeks-approval-for-chipmaking/

Không có file đính kèm.

Nguồn tham khảo

113

AI market AI chips-hardware-compute 2024-02-17 20:55:18

LIÊN DOANH CHIP AI ĐẦY THAM VỌNG CỦA MASAYOSHI SON – THEO ĐUỔI GIẤC MƠ TRỊ GIÁ 100 TỶ USD

- Masayoshi Son, người sáng lập SoftBank Group, đang hướng tới việc thiết lập một dự án chip AI đột phá với mục tiêu huy động được 100 tỷ đô la, mang tên mã là Izanagi.
- Dự án này đánh dấu sự chuyển hướng của Son khỏi các khoản đầu tư startup truyền thống, tập trung vào việc định hình tương lai của công nghệ AI thông qua đổi mới bán dẫn.
- Izanagi không chỉ nhằm cạnh tranh với các gã khổng lồ trong ngành như Nvidia mà còn muốn tạo ra một cường quốc trong phát triển chip AI, có thể tái định hình bức tranh công nghệ trong nhiều năm tới.
- Sự khám phá của dự án chip AI Izanagi bắt nguồn từ một sự tái định hướng chiến lược trong SoftBank, nơi các khoản đầu tư startup truyền thống được thay thế bằng các dự án nhắm vào cơ sở hạ tầng công nghệ cốt lõi.
- Son muốn sử dụng Izanagi như một viên gạch nền tảng trong nỗ lực thiết lập SoftBank thành một lực lượng thống trị trong lĩnh vực sản xuất chip AI, bổ sung cho khả năng của Arm Holdings, một đơn vị thiết kế chip thuộc sở hữu của SoftBank.
- Tham vọng của Son vượt ra ngoài các giới hạn thông thường, khi ông tưởng tượng Izanagi không chỉ là một đối thủ cạnh tranh với các nhà lãnh đạo ngành hiện tại mà còn là một chất xúc tác cho sự đổi mới.

📌 Masayoshi Son đang tiến hành một bước đi táo bạo với dự án chip AI Izanagi, với mục tiêu huy động được 100 tỷ đô la, không chỉ nhằm cạnh tranh với các gã khổng lồ công nghệ như Nvidia mà còn nhằm tạo ra một đế chế mới trong lĩnh vực phát triển chip AI. Dự án này không chỉ là một phần của sự chuyển hướng chiến lược của SoftBank từ các khoản đầu tư startup truyền thống sang các dự án tập trung vào cơ sở hạ tầng công nghệ cốt lõi mà còn là một nỗ lực nhằm bổ sung và tăng cường khả năng của Arm Holdings. Thông qua việc tạo ra sự hợp tác và sự đồng điệu giữa Izanagi và các thực thể khác trong hệ sinh thái rộng lớn của SoftBank, Son mong muốn khơi dậy một sự thay đổi lớn trong thế giới bán dẫn AI

Citations:
[1] https://www.cryptopolitan.com/masayoshi-sons-ai-chip-venture-100-billion/

Không có file đính kèm.

Nguồn tham khảo

AI nghiên cứu AI chips-hardware-compute 2024-02-16 17:55:54

ĐỘT PHÁ TRONG CÔNG NGHỆ CHIP AI

- Các kỹ sư tại Đại học Pennsylvania đã phát triển một chip AI đột phá sử dụng sóng ánh sáng thay vì điện để thực hiện các phép toán phức tạp cần thiết cho việc đào tạo AI.
- Chip này, được gọi là chip silicon-photonic (SiPh), hứa hẹn cải thiện đáng kể tốc độ xử lý máy tính và giảm tiêu thụ năng lượng, đánh dấu một bước tiến quan trọng trong công nghệ tính toán.
- Chip SiPh kết hợp chuyên môn của Nader Engheta trong việc điều khiển vật liệu ở cấp độ nano cho các phép toán dựa trên ánh sáng với công trình tiên phong của Firooz Aflatouni trong các thiết bị silicon ở cấp độ nano.
- Công trình nghiên cứu này được công bố trên Nature Photonics, mô tả sự ra đời của chip và tiềm năng của nó trong việc cách mạng hóa tính toán như chúng ta biết.
- Chip có khả năng kiểm soát sự truyền dẫn ánh sáng bằng cách làm mỏng silicon ở các khu vực cụ thể, tạo điều kiện cho việc thực hiện các phép toán toán học với tốc độ chóng mặt.
- Sự hợp tác giữa Engheta, Aflatouni và các nhóm nghiên cứu của họ là ví dụ về sự kết hợp giữa các lĩnh vực nghiên cứu sáng tạo, thúc đẩy các biên giới công nghệ tiến lên.

📌 Chip silicon-photonic (SiPh) đánh dấu một bước tiến quan trọng trong lĩnh vực công nghệ AI, với khả năng cải thiện đáng kể tốc độ xử lý máy tính và giảm tiêu thụ năng lượng. Sự đổi mới này không chỉ mở ra cánh cửa cho việc tăng cường hiệu suất và bảo mật trong các hệ thống AI mà còn đặt nền móng cho một kỷ nguyên mới của tính toán dựa trên ánh sáng.

Citations:
[1] https://www.cryptopolitan.com/breakthrough-in-ai-chip-technology/

Không có file đính kèm.

Nguồn tham khảo

150

OpenAI ChatGPT AI chips-hardware-compute 2024-02-09 10:44:49

Sam Altman tìm kiếm hàng nghìn tỷ đô la để định hình lại hoạt động kinh doanh chip và AI

- Sam Altman, CEO của OpenAI, đang thảo luận với các nhà đầu tư để huy động từ 5 đến 7 nghìn tỷ đô la cho dự án công nghệ bán dẫn.
- Mục tiêu của việc huy động vốn là giải quyết các rào cản cho sự phát triển của OpenAI, bao gồm sự khan hiếm của GPU đắt đỏ cần thiết để huấn luyện các mô hình ngôn ngữ lớn.
- Dự án này có thể làm tăng đáng kể công suất sản xuất chip toàn cầu và mở rộng khả năng hỗ trợ AI.
- Doanh số bán chip toàn cầu năm ngoái đạt 527 tỷ đô la và dự kiến sẽ tăng lên 1 nghìn tỷ đô la hàng năm vào năm 2030.
- Altman đã thảo luận với Bộ trưởng Thương mại Mỹ Gina Raimondo về sáng kiến này.
- OpenAI có thể trở thành khách hàng lớn của các nhà máy chip mới thông qua quan hệ đối tác với các nhà đầu tư, nhà sản xuất chip và nhà cung cấp năng lượng.
- Các cuộc thảo luận vẫn đang ở giai đoạn đầu và có thể kéo dài nhiều năm.
- Altman cũng đã gặp gỡ Sheikh Tahnoun bin Zayed al Nahyan của UAE và Masayoshi Son, CEO của SoftBank, cũng như đại diện từ các công ty sản xuất chip như TSMC.
- Microsoft, đối tác của OpenAI, biết về nỗ lực huy động vốn của OpenAI và ủng hộ chúng.

📌 Kế hoạch huy động vốn của Sam Altman, CEO của OpenAI, có thể coi là một bước tiến đầy tham vọng nhằm mở rộng khả năng sản xuất chip và hỗ trợ sự phát triển của AI trên toàn cầu. Với việc thảo luận về việc huy động từ 5 đến 7 nghìn tỷ đô la, Altman không chỉ đối mặt với thách thức về mặt tài chính mà còn cả những vấn đề liên quan đến chính sách và chiến lược quốc gia. Sự tham gia của các nhà đầu tư lớn như chính phủ UAE và các công ty công nghệ hàng đầu như Microsoft và TSMC cho thấy sự quan trọng của dự án này đối với tương lai của ngành công nghiệp AI. Tuy nhiên, với những rủi ro và không chắc chắn, chỉ thời gian mới có thể xác định liệu kế hoạch này có thể trở thành hiện thực hay không.

Citations:
[1] https://www.wsj.com/tech/ai/sam-altman-seeks-trillions-of-dollars-to-reshape-business-of-chips-and-ai-89ab3db0

Không có file đính kèm.

Nguồn tham khảo

100

AI chips-hardware-compute 2024-02-05 15:50:23

Startup chip bán dẫn Hàn Quốc thách thức sự thống trị của NVIDIA

- Rebellions, một startup chuyên về chip AI tại Hàn Quốc, đã gây chú ý khi tuyên bố mục tiêu cạnh tranh với Nvidia thông qua việc sản xuất chip bởi Samsung.
- Trong bối cảnh giá cổ phiếu của Nvidia tăng vọt trong năm qua, các startup về bán dẫn từ Silicon Valley đến Seoul đang nỗ lực gây quỹ để chiếm lĩnh thị trường chip AI đang phát triển nhanh chóng.
- Rebellions, được thành lập bởi một cựu quant của Wall Street và có trụ sở tại Seongnam, phía nam Seoul, đã công bố việc huy động được 124 triệu USD trong vòng gọi vốn Series B, nâng tổng số vốn huy động được lên 210 triệu USD, cao hơn bất kỳ startup chip AI nào khác tại Hàn Quốc.
- Sunghyun Park, đồng sáng lập và CEO của Rebellions, cho biết công ty của ông có thể cạnh tranh với Nvidia, công ty hiện đang chiếm lĩnh khoảng 90% thị phần và được biết đến với giá thành cao.
- Rebellions hợp tác với Samsung, công ty lớn nhất Hàn Quốc, và nhận được sự ủng hộ từ một số nhà đầu tư hàng đầu của quốc gia này, đặt mục tiêu trở thành "David" đối đầu với "Goliath" Nvidia, theo lời của Park.

📌 Rebellions, một startup hàng đầu về chip AI tại Hàn Quốc, đã thành công trong việc huy động được tổng cộng 210 triệu USD qua các vòng gọi vốn, bao gồm 124 triệu USD từ vòng Series B, đánh dấu mình là startup chip AI được tài trợ nhiều nhất tại Hàn Quốc. Với mục tiêu cạnh tranh trực tiếp với Nvidia - công ty chiếm lĩnh khoảng 90% thị phần và nổi tiếng với giá thành cao của sản phẩm, Rebellions đã bắt tay với Samsung, công ty lớn nhất Hàn Quốc, để sản xuất chip AI.

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2024-02-02 09:23:27

CXMT của Trung Quốc đặt mục tiêu xây dựng chip nhớ tiên tiến đầu tiên của đất nước cho AI

- ChangXin Memory Technologies (CXMT) của Trung Quốc đang nỗ lực sản xuất bộ nhớ băng thông cao (HBM) đầu tiên trong nước, một thành phần quan trọng trong tính toán AI, để giảm phụ thuộc vào nguồn cung cấp nước ngoài.
- CXMT đã đặt mua và nhận thiết bị sản xuất và kiểm tra từ các nhà cung cấp Mỹ và Nhật Bản phù hợp cho việc lắp ráp và sản xuất HBM.
- Công ty đặt trọng tâm phát triển công nghệ xếp chồng chip DRAM để mô phỏng kiến trúc của chip HBM, mặc dù công nghệ HBM của họ chưa sẵn sàng cho sản xuất hàng loạt.
- HBM được đầu tư mạnh mẽ do khả năng tăng tốc độ tính toán và ứng dụng AI. Ví dụ, chip Nvidia H100 kết hợp bộ xử lý đồ họa với sáu HBM để tạo ra phản hồi nhanh chóng, giống như con người.
- CXMT cũng đã bảo đảm thiết bị cho nhà máy thứ hai tại Hefei để sản xuất DRAM tiên tiến nhất của Trung Quốc từ nhà cung cấp địa phương, nhưng vẫn kém tiên tiến so với sản phẩm của Samsung và SK Hynix.
- Một số nhà cung cấp thiết bị hàng đầu Mỹ đã nhận được giấy phép từ Washington để xuất khẩu công cụ sản xuất chip cho nhà sản xuất chip nhớ Trung Quốc từ giữa năm 2023.
- Mỹ đã áp đặt kiểm soát xuất khẩu toàn diện vào tháng 10/2022 nhằm hạn chế khả năng sản xuất DRAM tiên tiến của Bắc Kinh, nhưng sau đó đã cấp phép cho một số nhà cung cấp với công nghệ ít tiên tiến hơn.
- CXMT không ngay lập tức phản hồi yêu cầu bình luận từ Nikkei Asia.
- CXMT đã bắt đầu sản xuất chip nhớ LPDDR5 đầu tiên của Trung Quốc vào cuối năm ngoái, dành cho smartphone cao cấp. Xiaomi và Transsion đã hoàn thành xác minh chip nhớ di động của CXMT.
- CXMT có ít hơn 1% thị phần DRAM toàn cầu vào năm 2023, trong khi ba người chơi chủ đạo (Samsung, SK Hynix và Micron) kiểm soát hơn 97%.
- HBM được kiểm soát bởi hai nhà sản xuất chip DRAM lớn nhất thế giới, SK Hynix và Samsung, với hơn 92% thị phần toàn cầu vào năm 2023.

📌 CXMT, nhà sản xuất chip nhớ hàng đầu của Trung Quốc, đang tiến gần hơn đến việc sản xuất bộ nhớ băng thông cao (HBM) đầu tiên trong nước, một thành phần quan trọng trong tính toán AI (VD: chip Nvidia H100 kết hợp bộ xử lý đồ họa với 6 HBM), với mục tiêu giảm sự phụ thuộc vào nguồn cung cấp nước ngoài trong bối cảnh đối mặt với các kiểm soát xuất khẩu từ Mỹ. Dù công nghệ HBM của họ chưa sẵn sàng cho sản xuất hàng loạt và thị phần DRAM toàn cầu của họ chỉ dưới 1% vào năm 2023, trong khi ba công ty chủ đạo (Samsung, SK Hynix và Micron) kiểm soát hơn 97%.

Không có file đính kèm.

Nguồn tham khảo

145

AI chips-hardware-compute 2024-02-02 04:18:37

Các nhà phân tích ước tính Nvidia sở hữu 98% thị trường GPU trung tâm dữ liệu

Nvidia đang thống trị thị trường GPU trung tâm dữ liệu, ước tính chiếm tới 98% thị phần.
Công ty dự kiến sẽ thu về từ 37 đến 45,7 tỷ đô la từ GPU trung tâm dữ liệu trong năm 2023 và 2024.
AMD đang cố gắng giành thị phần từ Nvidia, nhưng chỉ có thể giảm thị phần của Nvidia xuống còn 94-96% trong năm 2024.
Intel cũng đang tham gia thị trường GPU trung tâm dữ liệu, nhưng vẫn còn tụt hậu so với Nvidia và AMD.
Sự thống trị của Nvidia một phần là do sự thiếu hụt GPU trung tâm dữ liệu trên toàn cầu, cũng như nhu cầu ngày càng tăng đối với AI.

📌 Nvidia đang thống trị thị trường GPU trung tâm dữ liệu, với thị phần ước tính là 98%. Sự thống trị này là do sự kết hợp của nhiều yếu tố, bao gồm nhu cầu ngày càng tăng đối với AI, sự thiếu hụt GPU trung tâm dữ liệu trên toàn cầu và hệ sinh thái phần mềm mạnh mẽ của Nvidia. AMD và Intel đang cố gắng giành thị phần, nhưng Nvidia vẫn giữ vị trí dẫn đầu. Dự kiến trong năm 2024, Nvidia sẽ tiếp tục mở rộng vị thế thống trị của mình khi ra mắt GPU Blackwell. Tuy nhiên, sự tăng trưởng của Nvidia có thể bị hạn chế bởi tình trạng thiếu hụt CoWoS (chip trên wafer trên đế), một loại bao bì cần thiết cho GPU trung tâm dữ liệu.

Không có file đính kèm.

Nguồn tham khảo

129

AI chips-hardware-compute 2024-01-31 21:50:45

Sự bùng nổ AI thúc đẩy nhu cầu về công nghệ làm mát máy chủ

Làn sóng AI đang khiến nhu cầu về công nghệ làm mát máy chủ tăng mạnh.
Các chip và máy chủ dùng cho AI ngày càng phát nhiệt cao và tiêu tốn nhiều năng lượng hơn.
Lite-On Technology của Đài Loan là một trong những công ty đang tích cực phát triển các giải pháp làm mát dựa trên chất lỏng cho các trung tâm dữ liệu AI.
Nhiệt độ là một trong những thách thức lớn nhất để nâng cao hiệu năng tính toán của AI.
Lite-On đặt cược vào các giải pháp làm mát lỏng để giải quyết vấn đề phát nhiệt của chip và máy chủ AI.
Các công nghệ làm mát tinh vi hơn là điều cần thiết cho làn sóng trung tâm dữ liệu AI.

📌Làn sóng phát triển AI đòi hỏi các công nghệ làm mát máy chủ hiệu quả hơn. Các công ty như Lite-On của Đài Loan đang tập trung phát triển các giải pháp làm mát lỏng tiên tiến để giải quyết thách thức về nhiệt độ và tiêu thụ điện năng ngày càng cao của các hệ thống AI. Đây là xu hướng công nghệ quan trọng hỗ trợ sự phát triển của AI.

Không có file đính kèm.

Nguồn tham khảo

112

AI chips-hardware-compute 2024-01-31 07:53:46

Danh sách 18 công ty thiết kế chip AI thách thức NVIDIA, AMD, Google, Amazon và Microsoft

Anthropic: Được thành lập năm 2021, Anthropic tập trung phát triển các chip AI tiết kiệm năng lượng dành riêng cho các ứng dụng trí tuệ nhân tạo chung (AGI). Họ đã giới thiệu thiết bị Claude được thiết kế để mô phỏng suy nghĩ của con người. Chip AI của Anthropic giúp cải thiện hiệu quả năng lượng cho các mô hình AI phức tạp.
Cerebras: Được thành lập năm 2016, Cerebras phát triển chip AI tốc độ cao CS-1 dành riêng cho học sâu. Chip tập trung tối đa hóa băng thông và bộ nhớ đệm để tăng tốc độ huấn luyện cho các mạng học sâu lớn. Hệ thống CS-1 của Cerebras cho hiệu suất đào tạo AI cao hơn 26x so với GPU.
Graphcore: Được thành lập năm 2016, Graphcore sản xuất chip IPU (Intelligence Processing Unit) đột phá dành riêng cho đào tạo AI với kiến trúc tính toán song song. Chip Colossus GC200 của Graphcore tăng tốc độ huấn luyện mô hình AI so với GPU truyền thống.
Groq: Được thành lập năm 2017, Groq phát triển các chip chuyên dụng cho các ứng dụng học sâu và xử lý ngôn ngữ tự nhiên. Groq One là chip AI đầu tiên của công ty có tốc độ 1 PetaOPS, thích hợp cho AI real-time.
Habana Labs: Được thành lập năm 2016, Habana Labs sản xuất các thiết bị huấn luyện và chạy dự đoán AI. Họ có 2 dòng chip chính là chip Goya cho huấn luyện AI và chip Gaudi cho chạy AI inference, đạt hiệu suất cao mà tiêu thụ ít năng lượng hơn so với GPU. Habana Labs được Intel mua lại với giá 2 tỷ USD năm 2019.
Horizon Robotics: Được thành lập năm 2015, Horizon Robotics (Thượng Hải, Trung Quốc) phát triển chip AI xử lý âm thanh và hình ảnh chuyên dụng cho xe tự lái. Họ cung cấp các chip nền tảng Journey và Sunrise, tích hợp phần cứng và phần mềm cho xe tự lái.
Mythic: Được thành lập năm 2012, Mythic (Texas, Mỹ) thiết kế chip AI nhỏ gọn áp dụng trong cảm biến và thiết bị IoT nhờ công nghệ analog computing. Họ đã giới thiệu chip Mythic M1104 với mật độ năng lượng cao.
NeuReality: Được thành lập năm 2018, NeuReality (Israel) phát triển chip NR1 cho đào tạo và phân loại hình ảnh. NR1 tích hợp 240 nhân AI, cho phép đào tạo AI trên chiếc kính thực tế ảo.
Sima.ai: Được thành lập năm 2016, Sima.ai (Israel) cung cấp cả phần cứng và phần mềm cho các hệ thống AI tổng hợp. Họ phát triển bộ xử lý AI Sima-1 và nền tảng phần mềm Hampa.
SambaNova: Được thành lập năm 2017, SambaNova (California, Mỹ) phát triển hệ thống AI Reconfigurable được tối ưu cả phần cứng và phần mềm. Hệ thống Cardinal của họ đạt hiệu năng AI cao trên mọi nền tảng.
Syntiant: Được thành lập năm 2017, Syntiant (California, Mỹ) chuyên sản xuất các chip AI nhúng cho cảm biến và thiết bị IoT với kiến trúc neural network tích hợp. Họ cung cấp các chip Syntiant NDP100 và NDP101 cho các ứng dụng như trợ lý ảo.
Tenstorrent: Được thành lập năm 2016, Tenstorrent (Toronto, Canada) phát triển chip AI Grayskull dành riêng cho lĩnh vực xe tự lái và robot. Grayskull là chip AI tổng hợp đầu tiên cho xe tự lái cấp độ 4-5.
Untether AI: Được thành lập năm 2015, Untether AI (Toronto, Canada) thiết kế chip AI RISC-V cho camera AI và IoT. Họ cung cấp chip UAI-1 với khả năng xử lý AI nhanh chóng và hiệu quả.
Valence: Được thành lập năm 2019, Valence (California, Mỹ) phát triển các kiến trúc hệ thống cho chip AI và học sâu. Họ đã xây dựng nền tảng phần cứng và phần mềm cho công nghệ AI tiên tiến.
Wave Computing: Được thành lập năm 2010, Wave Computing (California, Mỹ) chuyên về kiến trúc dữ liệu động cho chip AI. Họ phát triển các bộ xử lý AI có khả năng tái cấu hình đáp ứng nhu cầu tính toán thay đổi.
Wiliot: Được thành lập năm 2017, Wiliot (Israel) phát triển chip AI Arm chuyên dụng cho IoT và cảm biến không dây. Họ cung cấp chip Bluetooth tích hợp AI cho các thiết bị thông minh, có thể hoạt động 5-10 năm chỉ với pin cỡ viên kẹo.
XMOS: Được thành lập năm 2005, XMOS (Anh) phát triển bộ xử lý AI đa nhân xCORE dành riêng cho cạnh mạng và cảm biến thông minh. Họ cung cấp các chip xử lý AI nhúng Xcore.ai cho các thiết bị IoT.
Zedsen: Được thành lập năm 2014, Zedsen (Canada) chuyên về thiết kế chip xử lý tín hiệu số Z-100 cho các ứng dụng AI edge. Chip của Zedsen tối ưu hóa hiệu năng và hiệu quả năng lượng cho AI.

Không có file đính kèm.

Nguồn tham khảo

146

AI chips-hardware-compute 2024-01-29 20:56:48

Siêu máy tính tự chế tạo đầu tiên của Trung Quốc đi vào hoạt động - Trung tâm Điện toán Thông minh Trung tâm được làm mát bằng chất lỏng và được chế tạo cho AI

Trung Quốc đã chế tạo thành công siêu máy tính đầu tiên do nước này tự sản xuất hoàn toàn, có tên là Trung tâm Điện toán Thông minh Trung ương.
Siêu máy tính này được làm mát bằng chất lỏng và được thiết kế để phục vụ cho trí tuệ nhân tạo (AI).
Trung tâm Điện toán Thông minh Trung ương có thể huấn luyện các mô hình ngôn ngữ lớn (LLM) với hàng nghìn tỷ tham số.
Trung Quốc không công bố thông số kỹ thuật chi tiết của siêu máy tính này, nhưng có nguồn tin cho rằng nó có hiệu suất lên tới 5 exaflop.
Việc Trung Quốc chế tạo thành công siêu máy tính này là một bước tiến quan trọng trong nỗ lực giành độc lập công nghệ của nước này.

📌Trung Quốc đã chế tạo thành công siêu máy tính đầu tiên do nước này tự sản xuất hoàn toàn, có tên là Trung tâm Điện toán Thông minh Trung ương. Đây là một bước tiến quan trọng trong nỗ lực giành độc lập công nghệ của Trung Quốc. Siêu máy tính này được làm mát bằng chất lỏng và được thiết kế để phục vụ cho AI. Trung tâm Điện toán Thông minh Trung ương có thể huấn luyện các mô hình ngôn ngữ lớn (LLM) với hàng nghìn tỷ tham số. Mặc dù Trung Quốc không công bố thông số kỹ thuật chi tiết của siêu máy tính này, nhưng có nguồn tin cho rằng nó có hiệu suất lên tới 5 exaflop.

Không có file đính kèm.

Nguồn tham khảo

149

AI chips-hardware-compute 2024-01-28 17:20:18

Intel sẽ mang lại bước nhảy vọt gấp 5 lần về AI chỉ trong hai thế hệ chip – Panther Lake vào năm 2025 sẽ tăng gấp đôi hiệu suất AI so với Arrow Lake và Lunar Lake

Intel đang hướng tới một bước nhảy vọt với hiệu suất AI, tăng gấp 5 lần chỉ trong hai thế hệ chip.
Chip Panther Lake dự kiến ra mắt năm 2025 sẽ gấp đôi hiệu suất AI so với các thế hệ chip Arrow Lake và Lunar Lake.
CEO Pat Gelsinger của Intel thông báo trong cuộc gọi thu nhập quý 4 rằng Lunar Lake và Arrow Lake sẽ ra mắt sau này trong năm, và cả hai sẽ gấp ba lần hiệu suất AI so với Meteor Lake.
Sự cải tiến mạnh mẽ này phần lớn đến từ Arrow Lake và Lunar Lake, với Panther Lake làm tăng gấp đôi hiệu suất của Arrow Lake, dẫn đến một sự cải thiện tổng thể lên đến 5 lần so với Meteor Lake.
Các chip Xeon Clearwater Forest, dựa trên nút sản xuất Intel 18A, đã được đưa vào sản xuất, và Panther Lake sẽ sớm theo sau.
Intel 18A được kỳ vọng sẽ đạt sẵn sàng sản xuất vào nửa sau của năm 2024, hoàn thành mục tiêu phát triển năm nút công nghệ trong vòng bốn năm và đưa Intel trở lại với vị thế dẫn đầu về công nghệ sản xuất chip.
Tăng hiệu suất AI này được thêm vào những cải thiện dự kiến trong hiệu suất và hiệu quả của CPU truyền thống, nhờ phần nào vào việc sử dụng nút Intel 18A cho Panther Lake.

📌 Intel đang hướng đến việc cung cấp một sự cải thiện đáng kể trong hiệu suất AI với chip Panther Lake, dự kiến ra mắt vào năm 2025, sẽ mang lại hiệu suất gấp đôi so với thế hệ chip Arrow Lake và Lunar Lake. Điều này đại diện cho một bước nhảy vọt lên đến 5 lần so với Meteor Lake chỉ trong hai thế hệ chip tiếp theo, đồng thời đánh dấu sự trở lại của Intel trong cuộc đua công nghệ sản xuất chip với việc hoàn thành mục tiêu phát triển năm nút công nghệ trong bốn năm và kỳ vọng nút Intel 18A sẽ đạt sẵn sàng sản xuất vào nửa sau của năm 2024.

Không có file đính kèm.

Nguồn tham khảo

190

AI chips-hardware-compute 2024-01-27 19:53:14

MỨC TĂNG VỌT CỦA ASML LÀM NỔI BẬT SỨC SỐNG CHO CÁC NHÀ SẢN XUẤT CHIP AI

ASML Holding NV, công ty công nghệ giá trị nhất của Châu Âu, chứng kiến đà tăng giá cổ phiếu kỷ lục, đạt mức cao mới trong tuần này.
Công ty có tuần tốt nhất trong hơn một năm với mức tăng ấn tượng 16% sau khi công bố kết quả kinh doanh mạnh mẽ, phản ánh nhu cầu mạnh mẽ đối với máy móc tiên tiến của họ.
Sự phục hồi nhanh chóng về số lượng đơn đặt hàng, đặc biệt là trong lĩnh vực bộ nhớ băng thông cao, được thúc đẩy bởi nhu cầu tăng mạnh đối với trí tuệ nhân tạo (AI).
ASML đóng vai trò quan trọng trong cơ sở hạ tầng AI, với các hệ thống in thạc bản tia cực tím (EUV) được coi là yếu tố cơ bản cho việc sản xuất chip hiện đại.
Nhu cầu đột biến đối với máy móc của ASML, do nhu cầu cấp thiết về cơ sở hạ tầng AI, nhấn mạnh vai trò không thể thiếu của công ty trong việc thúc đẩy công nghệ AI.
Mặc dù ASML đối mặt với sự chậm trễ trong đơn đặt hàng từ khách hàng lớn vào năm 2023, sự phục hồi hiện tại cho thấy một bước ngoặt.
Cổ phiếu của ASML có thể có vẻ đắt đỏ khi nhìn vào dự báo doanh thu năm sau nhưng được dự đoán sẽ trở nên hợp lý khi xem xét doanh thu năm 2025.
ASML dự kiến sẽ có một năm chuyển tiếp với sự tăng trưởng hạn chế trong năm 2024, nhưng vẫn có những dấu hiệu tích cực trong ngành công nghiệp chip.

📌 Mặc dù phải đối mặt với những bất ổn trong ngắn hạn, ASML Holding NV tiếp tục thể hiện tầm quan trọng không thể thiếu của mình trong ngành công nghiệp bán dẫn, đặc biệt là trong bối cảnh nhu cầu cấp thiết đối với cơ sở hạ tầng AI ngày càng tăng. Sự bùng nổ trong đơn hàng và kết quả kinh doanh mạnh mẽ phản ánh sự công nhận của ngành công nghiệp đối với vai trò trung tâm của ASML trong việc thúc đẩy công nghệ sản xuất chip cần thiết để hiện thực hóa tiềm năng đầy đủ của AI.

Không có file đính kèm.

Nguồn tham khảo

115

AI chips-hardware-compute AI PC AI smartphone AI consumer devices 2024-01-26 10:35:34

Bối cảnh sắp tới của chip AI

AI không phải là công nghệ "cỡ nào cũng vừa", và cũng không có bộ xử lý "cỡ nào cũng vừa" cho AI. Hiện có nhiều mô hình được phát triển cho các mục đích khác nhau.
Các tác vụ AI được triển khai trên nhiều thiết bị như IoT thông minh, điện thoại thông minh, PC, xe cộ, và trong các trung tâm dữ liệu lớn và cơ sở hạ tầng đám mây.
Các bộ xử lý lớn nhất, chủ yếu từ Nvidia, đã chiếm nhiều tiêu đề, nhưng có một loạt nhà cung cấp bộ xử lý khác sẽ thực hiện các tác vụ AI trong toàn bộ hệ sinh thái thiết bị và ứng dụng.
Trong một đến hai năm tới, dự kiến 80-90% tất cả các tác vụ sẽ chạy trên xử lý suy luận, trên nhiều loại chip từ bộ xử lý nhỏ trong thiết bị người dùng cuối, đến bộ xử lý kích thước trung bình chạy ở cạnh hoặc trong trung tâm dữ liệu.
Có một hệ sinh thái lớn của bộ xử lý tăng tốc AI sẽ có sẵn từ nhiều nhà cung cấp. ARM và RISC-V đang bổ sung khả năng tăng tốc AI cho hệ sinh thái của mình, Qualcomm và MediaTek cung cấp bộ xử lý cho điện thoại thông minh cao cấp với NPU tích hợp.
Máy tính cá nhân sẽ có bộ tăng tốc AI tích hợp trong chip từ Intel và AMD, thêm nhiều tính năng mới do AI hỗ trợ cho các thiết bị và ứng dụng của chúng.
Trong lĩnh vực máy chủ, trung tâm dữ liệu và đám mây, sự chuyển đổi sang AI đang tạo ra thị trường thay thế, kích thích chu kỳ làm mới mạnh mẽ trong hai đến ba năm tới.
Dự kiến ít nhất 65-75% máy tính cá nhân sẽ có bộ tăng tốc AI tích hợp trong ba năm tới, cũng như hầu hết điện thoại thông minh cấp trung đến cao cấp.
AI đang mở rộng nhanh chóng từ cơ sở hiện tại của các chip hiệu suất cao chạy các hệ thống đào tạo lớn để bao gồm một loạt các giải pháp dựa trên suy luận. Sự mở rộng này sẽ cho phép tạo ra nhiều giải pháp mới dựa trên khả năng tăng tốc được tích hợp trong phần lớn các chip thế hệ tiếp theo.

Không có file đính kèm.

Nguồn tham khảo

224

OpenAI ChatGPT AI chips-hardware-compute 2024-01-21 06:45:01

Sam Altman tìm kiếm hàng tỷ USD để thành lập các nhà máy sản xuất chip AI

Sam Altman, CEO của OpenAI, đang cố gắng gây quỹ hàng tỷ đô la từ các nhà đầu tư toàn cầu để thiết lập một mạng lưới nhà máy sản xuất bán dẫn.
Altman đã tiến hành thảo luận với nhiều nhà đầu tư tiềm năng lớn nhằm huy động số vốn cần thiết cho các nhà máy sản xuất chip (fabrics), theo thông tin từ các nguồn giấu tên.
Các công ty đã thảo luận với Altman bao gồm G42 có trụ sở tại Abu Dhabi và SoftBank Group Corp. Dự án sẽ hợp tác với các nhà sản xuất chip hàng đầu và mạng lưới các nhà máy sẽ có phạm vi toàn cầu.
Mục tiêu của Altman phản ánh mối quan ngại rằng khi AI trở nên phổ biến hơn, sẽ không đủ chip để triển khai rộng rãi, và các dự báo hiện tại về sản xuất chip liên quan đến AI không đáp ứng được nhu cầu dự kiến.
Việc xây dựng và duy trì các nhà máy sản xuất bán dẫn rất tốn kém so với phương pháp thiết kế chip silicon tùy chỉnh và sau đó thuê bên ngoài sản xuất, phương pháp mà các đối tác ngành AI của OpenAI thường áp dụng.
Việc xây dựng một nhà máy sản xuất tiên tiến có thể cần đến hàng chục tỷ đô la, và việc tạo ra một mạng lưới các cơ sở như vậy sẽ mất nhiều năm. Các cuộc thảo luận với G42 tập trung vào việc gây quỹ 8-10 tỷ đô la.
Intel Corp., Taiwan Semiconductor Manufacturing Co., và Samsung Electronics Co. là những đối tác tiềm năng cho OpenAI trong dự án này.

📌 Sam Altman đang nỗ lực mạnh mẽ nhằm thiết lập mạng lưới các nhà máy sản xuất chip AI để đáp ứng nhu cầu ngày càng tăng trong kỷ nguyên AI đang bùng nổ. Với việc cần đến hàng chục tỷ đô la cho mỗi nhà máy và mục tiêu gây quỹ lên đến 8-10 tỷ đô la chỉ với G42, dự án này thể hiện quy mô và tham vọng lớn. Nếu thành công, việc này có thể đảm bảo nguồn cung chip AI đủ lớn để đáp ứng nhu cầu toàn cầu vào cuối thập kỷ này.

Không có file đính kèm.

Nguồn tham khảo

130

AI chips-hardware-compute OpenAI ChatGPT 2024-01-21 06:29:43

Sam Altman đang đàm phán với công ty sản xuất chất bán dẫn Đài Loan để khởi động nhà máy chip AI

Sam Altman, người đứng đầu của công ty khởi nghiệp AI OpenAI, đang có cuộc thảo luận với Taiwan Semiconductor Manufacturing Company (TSMC).
Mục đích là để khởi động một nhà máy sản xuất chip AI tại Đài Loan.
Động thái này được xem là phần của kế hoạch mở rộng quy mô sản xuất chip AI, đáp ứng nhu cầu ngày càng tăng.
Thông tin này, tuy chưa được xác nhận chính thức từ cả hai bên, đã thu hút sự chú ý lớn từ giới công nghệ.
TSMC là công ty sản xuất bán dẫn hàng đầu thế giới, nổi tiếng với việc cung cấp chip cho nhiều công ty công nghệ lớn.
Việc hợp tác giữa OpenAI và TSMC có thể tạo ra những bước tiến lớn trong ngành công nghiệp chip AI, thúc đẩy sự phát triển của AI.

📌 Bài viết không cung cấp thông tin chi tiết về quy mô đầu tư, thời gian dự kiến hoàn thành dự án, hay cụ thể về loại chip AI mà nhà máy sẽ sản xuất. Tuy nhiên, sự kết hợp giữa OpenAI, với uy tín và kỹ thuật tiên tiến trong lĩnh vực AI, cùng TSMC, một công ty sản xuất chip đẳng cấp thế giới, hứa hẹn sẽ mang đến những cải tiến đáng kể cho ngành công nghiệp AI. Sự hợp tác này có thể sẽ làm thay đổi cảnh quan cạnh tranh trong ngành sản xuất chip AI, đồng thời cung cấp những giải pháp công nghệ mới cho thị trường.

Không có file đính kèm.

Nguồn tham khảo

141

AI kiến thức-khóa học AI chips-hardware-compute 2024-01-16 17:26:57

NPU là gì: giải thích về chip AI mới

NPU, hay còn gọi là Neural Processing Unit, là một loại bộ vi xử lý chuyên biệt được thiết kế để tăng tốc các hoạt động của mạng nơ-ron và nhiệm vụ AI.
Khác biệt với CPU và GPU đa năng, NPU được tối ưu hóa cho tính toán song song dựa trên dữ liệu, làm cho chúng rất hiệu quả trong việc xử lý dữ liệu đa phương tiện lớn như video và hình ảnh cũng như dữ liệu cho mạng nơ-ron.
NPUs không giống với ASICs (Application-Specific Integrated Circuits), chúng có độ phức tạp và linh hoạt hơn, đáp ứng nhu cầu đa dạng của tính toán mạng.
NPUs thường được tích hợp vào CPU chính, như trong dòng Intel Core và Core Ultra hoặc bộ vi xử lý laptop AMD Ryzen 8040-series. Trong các trung tâm dữ liệu lớn hoặc hoạt động công nghiệp chuyên biệt, NPU có thể là một bộ vi xử lý riêng biệt trên bo mạch chủ.
NPUs trong PC và laptop đang trở nên phổ biến, như trong bộ vi xử lý Intel Core Ultra và Qualcomm Snapdragon X Elite, giúp xử lý nhanh các nhiệm vụ AI và giảm tải cho các bộ vi xử lý khác.
Trong điện thoại thông minh, NPUs đóng vai trò quan trọng trong việc tính toán AI và các ứng dụng, như trên chip di động Bionic của Apple và các tính năng như Bixby Vision trên thiết bị Galaxy của Samsung.
NPUs còn được sử dụng trong các thiết bị khác như TV và camera, nâng cấp độ phân giải nội dung cũ lên 4K hoặc cải thiện chất lượng hình ảnh và nhiều hơn nữa.

📌 NPU đại diện cho bước tiến lớn trong lĩnh vực AI và máy học ở cấp độ tiêu dùng. Chúng giúp giảm tải cho CPU và GPU truyền thống, dẫn đến hệ thống tính toán hiệu quả hơn và cung cấp công cụ cho nhà phát triển để tận dụng trong phần mềm AI mới, như chỉnh sửa video trực tiếp hoặc soạn thảo tài liệu. NPU sẽ đóng vai trò quan trọng trong việc xử lý các nhiệm vụ trên PC hoặc thiết bị di động của bạn trong tương lai.

Không có file đính kèm.

Nguồn tham khảo

181

AI chips-hardware-compute 2024-01-16 10:34:09

'Big Chip': Trung Quốc đang chế tạo bộ xử lý cỡ tấm wafer để chống lại lệnh trừng phạt của Mỹ đối với siêu máy tính và AI

Các nhà khoa học Trung Quốc đang phát triển "Big Chip", một bộ vi xử lý kích thước bằng cả một tấm silicon wafer để vượt qua lệnh trừng phạt của Mỹ đối với siêu máy tính và AI.
"Zhejiang", phiên bản sớm của Big Chip, có diện tích hàng nghìn mm² và bao gồm 16 chiplet với 256 lõi, có khả năng mở rộng lên tới 100 chiplet, tương đương 1,600 lõi.
Big Chip sử dụng wafer-scale integration (WSI) để vượt qua giới hạn diện tích của máy móc lithography hiện đại và có hơn một nghìn tỷ transistor.
Thiết kế kiến trúc của Big Chip ảnh hưởng đến hiệu suất với hệ thống bộ nhớ thống nhất cho phép truy cập trực tiếp đến bộ nhớ từ bất kỳ lõi nào trên chip.
Công ty AI Mỹ, Cerebras System, cũng sử dụng WSI để xây dựng chip lên tới 46,225 mm² và đã bán hệ thống chứa WSE-1 vào năm 2020 với giá vài triệu đô la.
Big Chip vẫn đối mặt với các thách thức như tỷ lệ lỗi, làm mát và vấn đề hiệu suất.

📌 Big Chip của Trung Quốc, với thiết kế wafer-scale integration và sức mạnh từ 16 chiplets có khả năng mở rộng lên tới 1,600 lõi, đang mở ra cánh cửa mới cho việc phát triển siêu máy tính và AI mà không phụ thuộc vào công nghệ nhập khẩu. Dù còn đối diện với những thách thức kỹ thuật như tỷ lệ lỗi cao và khó khăn trong việc làm mát, thành công của nó có thể giúp Trung Quốc vượt qua các lệnh trừng phạt của Mỹ, đồng thời củng cố vị thế trong cuộc đua công nghệ toàn cầu. Sự phát triển này không chỉ cho thấy khả năng tự cường trong ngành công nghiệp bán dẫn mà còn là một bước tiến đáng kể trong cuộc chiến giành ưu thế trong lĩnh vực AI và tính toán hiệu năng cao (HPC).

Không có file đính kèm.

Nguồn tham khảo

108

AI chips-hardware-compute 2024-01-14 20:32:41

'Đối với nhiều ứng dụng AI, GPU tính toán quá mức cần thiết, tiêu tốn nhiều năng lượng và tiền bạc hơn mức cần thiết'

Ampere Computing, một startup đang thách thức sự thống trị của các gã khổng lồ công nghệ như AMD, Nvidia, và Intel, đang nổi lên như một lựa chọn thay thế trong lĩnh vực AI với giải pháp có hiệu suất cao và tiêu thụ điện năng thấp.
Dù là một công ty non trẻ chỉ mới 6 năm tuổi, Ampere đã dự đoán nhu cầu về giải pháp tính toán mới cho đám mây và bây giờ đang cung cấp chính xác những gì thị trường cần. Sản phẩm của Ampere đã được chấp nhận bởi hầu như tất cả các hyperscaler lớn trên thế giới và sự tăng trưởng nhanh chóng trong việc áp dụng ở doanh nghiệp.
Ampere đã vượt qua "bức tường tỷ lệ" nhiều lần, là công ty đầu tiên đạt 128 và sau đó là 192 lõi. Họ đang áp dụng một cách tiếp cận mới trong thiết kế CPU, từ vi kiến trúc đến bộ tính năng, giúp họ tiếp tục mở rộng mà các kiến trúc truyền thống không thể làm được.
Với sự xuất hiện của RISC-V và sự hậu thuẫn từ Trung Quốc, Jeff Wittich của Ampere chia sẻ rằng công ty sẽ sử dụng công nghệ tốt nhất có sẵn để duy trì hiệu suất và khả năng mở rộng hàng đầu.
Ampere cũng đang tập trung vào việc phát triển sản phẩm cho AI suy luận, đáp ứng mục tiêu bền vững của nhà cung cấp đám mây và người dùng. Họ hướng đến việc cung cấp hiệu suất dự đoán, loại bỏ vấn đề "hàng xóm ồn ào", và cho phép sử dụng CPU ở mức sử dụng cao.

📌 Ampere Computing đã nhanh chóng trở thành lựa chọn hàng đầu trong thị trường CPU dành cho máy chủ với mục tiêu cung cấp hiệu suất cao và tiêu thụ điện năng thấp. Công ty đã đánh dấu sự hiện diện của mình bằng việc được áp dụng bởi hầu hết các hyperscaler lớn và tiếp tục phát triển sản phẩm hướng đến AI suy luận. Đột phá về số lượng lõi trên CPU, với việc đạt 128 và sau đó là 192 lõi, cùng với phương châm sử dụng công nghệ tốt nhất có sẵn, Ampere hứa hẹn sẽ tiếp tục mở rộng khả năng của mình trong ngành công nghệ đang phát triển nhanh chóng này. Sự chấp nhận rộng rãi của sản phẩm từ phía doanh nghiệp và sự tăng trưởng trong việc sử dụng cho các ứng dụng AI chứng minh rằng Ampere không chỉ đáp ứng nhu cầu hiện tại mà còn đang định hình tương lai của tính toán đám mây và AI.

Không có file đính kèm.

Nguồn tham khảo

157

AI chips-hardware-compute AI nhỏ AI PC 2024-01-11 15:54:39

NVIDIA TIẾT LỘ CHIP AI TIÊU DÙNG MỚI VÀ CÔNG CỤ AI CỤC BỘ

Nvidia giới thiệu ba chip AI mới dành cho người tiêu dùng và công cụ AI cục bộ: RTX 4060 Super, RTX 4070 Ti Super, và RTX 4080 Super, với giá từ 599 đến 999 đô la Mỹ.
Các GPU này có thêm lõi tensor, được thiết kế để xử lý hiệu quả các ứng dụng AI tạo sinh.
Chúng hứa hẹn mang lại khả năng AI đặc biệt cho máy tính cá nhân, không cần phần cứng chuyên biệt.
Nvidia hợp tác với các nhà sản xuất laptop hàng đầu như Acer, Dell, và Lenovo để tích hợp chip vào sản phẩm của họ.
Hỗ trợ các mô hình AI đa dạng như Phi-2, Llama2, Mistral-7B, và Code Llama.
Tensor-LM inference backend của Nvidia giúp chạy các mô hình này một cách dễ dàng trên máy cá nhân.
Người dùng có thể chuyển sang sử dụng mô hình OpenAI trên đám mây chỉ với một dòng code.
Nvidia cũng cung cấp AI workbench, hỗ trợ các quy trình làm việc toàn diện cho Large Language Models (LLMs).
Nhu cầu đối với GPU lớn hơn như A100s và H100s vẫn mạnh mẽ, được sử dụng rộng rãi bởi các công ty AI để huấn luyện và phục vụ mô hình của họ thông qua các nền tảng đám mây.
Nvidia không chỉ tập trung vào phần cứng AI cho người tiêu dùng mà còn phát triển cơ sở hạ tầng AI trên đám mây.
Công ty cũng giới thiệu công cụ phát triển dễ sử dụng, giúp tích hợp AI vào môi trường máy tính địa phương.

📌 Nvidia đang làm thay đổi cách người tiêu dùng tương tác với AI thông qua việc giới thiệu các chip AI mới và công cụ phát triển dễ sử dụng. Các chip AI RTX 40 series mở ra cơ hội sử dụng AI mạnh mẽ trong máy tính cá nhân, trong khi việc hợp tác với các nhà sản xuất laptop như Acer, Dell, và Lenovo giúp AI trở nên phổ biến hơn. Việc hỗ trợ các mô hình AI đa dạng và cung cấp công cụ phát triển dễ dàng sử dụng khẳng định vai trò của Nvidia trong việc đưa AI vào cuộc sống hàng ngày của người dùng.

Không có file đính kèm.

Nguồn tham khảo

208

AI chips-hardware-compute AI smartphone 2024-01-04 19:33:04

AI tạo sinh đang 'tiến hóa rất, rất nhanh' trên thiết bị di động

Cristiano Amon, CEO của Qualcomm, đang định hướng công ty phát triển trong lĩnh vực AI trên thiết bị di động, một thay đổi lớn so với trọng tâm trước đây là smartphone.
Qualcomm, dưới sự dẫn dắt của Amon, đang mở rộng sang các lĩnh vực mới như máy tính cá nhân và xe hơi để giảm phụ thuộc vào thị trường di động đang chững lại.
Mặc dù cổ phiếu Qualcomm tăng khoảng 1/3 trong năm 2023, công ty vẫn chịu ảnh hưởng từ thị trường di động không mạnh mẽ, khác biệt với sự tăng trưởng do AI của các đối thủ như Nvidia, AMD và Intel.
Amon tin rằng AI trên thiết bị di động sẽ thay đổi cách cạnh tranh trong ngành công nghiệp lâu năm bởi Apple và Google.
Qualcomm đang phát triển chip xử lý AI riêng biệt cho thiết bị di động để chạy các mô hình AI hiệu quả hơn.
Amon kỳ vọng AI sẽ tạo ra chu kỳ nâng cấp mới cho smartphone, làm tăng nhu cầu thị trường và mang lại lợi ích kinh tế cho Qualcomm.

📌 Qualcomm, với chiến lược mới hướng đến AI trên thiết bị di động dưới sự lãnh đạo của CEO Cristiano Amon, đang mở rộng ảnh hưởng ra ngoài thị trường smartphone truyền thống. Điều này không chỉ mở ra cơ hội trong các lĩnh vực như xe hơi và máy tính cá nhân, mà còn giúp Qualcomm cạnh tranh mạnh mẽ hơn trong thị trường AI, nơi các đối thủ như Nvidia, AMD và Intel đang chiếm ưu thế. Sự chuyển mình này có tiềm năng tạo ra chu kỳ nâng cấp mới cho smartphone, tăng cường doanh số và lợi nhuận cho Qualcomm, đồng thời thay đổi cách thức cạnh tranh trong ngành công nghệ di động.

Không có file đính kèm.

Nguồn tham khảo

147

AI chips-hardware-compute 2023-12-26 08:17:56

Dell hợp tác với AMD để mở rộng danh mục AI tạo sinh của mình nhằm mang đến nhiều sự lựa chọn hơn cho khách hàng

Dell đã mở rộng danh mục máy chủ tính toán hiệu năng cao của mình, bổ sung một máy chủ dùng chip AMD dành cho tải trọng công việc AI.
Bên cạnh phiên bản sử dụng chip Nvidia, khách hàng sẽ sớm có thể mua phiên bản mới của Dell PowerEdge XE9680, trang bị tám bộ tăng tốc AMD Instinct MI300X. Điều này giúp doanh nghiệp đào tạo và vận hành các mô hình ngôn ngữ lớn (LLMs) của riêng mình, với 1.5GB bộ nhớ băng thông cao (HBM3) và hiệu suất hơn 21 petaFLOPS.
Khách hàng cũng có thể mở rộng hệ thống mà họ triển khai với chuẩn kết nối bộ nhớ toàn cầu (xGMI), và kết nối GPU của AMD qua mạng AI dựa trên Ethernet với Dell PowerSwitch Z9664F-ON. Điều này diễn ra sau khi Dell ra mắt đơn vị trang bị GPU Nvidia H100 vào đầu năm nay.
Điều này đồng thời đi kèm với một chuẩn mới có tên Dell Validated Design for Generative AI with AMD, là một khung cảnh cho các tổ chức muốn vận hành phần cứng và kiến trúc mạng của riêng mình để chạy LLMs.
Khách hàng của Dell có thể sử dụng giải pháp này để xây dựng nền tảng AI tạo sinh với các framework hướng dẫn tích hợp công nghệ cũng như cài đặt vật lý và tối ưu hóa hiệu suất.
Máy chủ cũng sử dụng bộ framework AI dựa trên AMD ROCm, là một gói mã nguồn mở của trình điều khiển, bộ công cụ phát triển và API tương thích với bộ tăng tốc AMD Instinct. Chúng bao gồm các framework phổ biến như PyTorch, TensorFlow và OpenAI Triton, đều hỗ trợ trên PowerEdge XE9680 trang bị bộ tăng tốc AMD.
Sự đẩy mạnh của Dell cho mạng lưới dựa trên chuẩn, với vai trò là thành viên của Ultra Ethernet Consuortium (UEC), có nghĩa là công ty chọn một cách tiếp cận mở hơn so với Nvidia.
Mặc dù Nvidia là một nhà lãnh đạo trong ngành cơ sở hạ tầng AI, AMD khác biệt ở chỗ ủng hộ một mạng Ethernet mở cho AI, nơi các thiết bị chuyển mạch từ các nhà cung cấp khác nhau có thể hoạt động cùng nhau trên cùng một hệ thống. Tương tự, Dell muốn các doanh nghiệp tiếp cận một cách mở với các thành phần tính toán, mạng lưới cũng như lưu trữ cần thiết để vận hành các mô hình AI tạo sinh nội bộ.
Phần cứng và dịch vụ mới trong đợt đẩy mạnh AI mới nhất của Dell dự kiến sẽ có sẵn trong nửa đầu năm tới.

📌 Dell đã mở rộng danh mục máy chủ tính toán hiệu năng cao của mình, bổ sung một máy chủ dùng chip AMD dành cho tải trọng công việc AI. Sự bổ sung máy chủ chạy chip AMD vào danh mục máy chủ tính toán hiệu năng cao của Dell cho thấy sự mở rộng và đa dạng hóa trong lựa chọn công nghệ AI, đặc biệt là trong việc hỗ trợ

Không có file đính kèm.

Nguồn tham khảo

AI chips-hardware-compute 2023-12-24 16:53:37

Google đang nhanh chóng trở thành đối thủ đáng gờm của BFF Nvidia - chip AI TPU v5p cung cấp năng lượng cho siêu máy tính của nó nhanh hơn, có nhiều bộ nhớ và băng thông hơn bao giờ hết, đánh bại cả H100 hùng mạnh

Google vừa ra mắt TPU v5p, chip AI mạnh mẽ nhất của hãng, làm tăng cạnh tranh với Nvidia.
TPU v5p nhanh hơn 2.8 lần so với TPU v4 trong việc đào tạo mô hình ngôn ngữ lớn và có giá trị cao hơn 2.1 lần.
Sản phẩm này được tích hợp trong kiến trúc 'AI Hypercomputing' của Google, dành riêng cho việc chạy ứng dụng AI.
TPU v5p có 8,960 chip mỗi pod, gấp đôi so với TPU v4, và có thể mở rộng gấp bốn lần về số FLOPs mỗi pod.
Cung cấp thông lượng 4,800Gbps và có 95GB bộ nhớ HBM, so với 32GB HBM RAM của TPU v4.
Google không bán TPU cho các công ty khác, chỉ sử dụng nội bộ cho các sản phẩm và dịch vụ của mình.
TPU v5p cạnh tranh với H100 của Nvidia, được coi là một trong những card đồ họa tốt nhất cho tải trọng công việc AI.
TPU v4 của Google ước tính nhanh hơn từ 1.2 đến 1.7 lần so với A100 của Nvidia.
Cần thêm benchmarking chi tiết để đánh giá chính xác tốc độ TPU v5p so với H100.

📌 Google đang nhanh chóng trở thành đối thủ đáng gờm của Nvidia với chip AI TPU v5p mới, cung cấp hiệu suất cao và đáng giá tiền. Với 8,960 chip mỗi pod và 95GB bộ nhớ HBM, TPU v5p vượt trội hơn hẳn TPU v4 và có khả năng cạnh tranh với GPU H100 của Nvidia, đặt nền tảng vững chắc cho kiến trúc 'AI Hypercomputing' của Google.

Không có file đính kèm.

Nguồn tham khảo

147

AI chips-hardware-compute AI startup-M&A 2023-12-20 09:06:46

Công ty khởi nghiệp Nhật Bản Preferred Networks thiết kế chip AI riêng để khắc phục tình trạng nghẽn cổ chai

Bài viết nói về công ty startup Nhật Bản Preferred Networks, đang phát triển chip AI riêng để giải quyết vấn đề tắc nghẽn.
Công ty này nhấn mạnh sự cần thiết của việc tạo ra chip AI tùy chỉnh, nhằm tối ưu hóa hiệu suất cho các nhu cầu cụ thể.
Bài viết giới thiệu rằng chip AI của Preferred Networks sẽ tập trung vào tăng tốc độ xử lý và hiệu quả năng lượng.
Đề cập đến thách thức trong việc phát triển và sản xuất chip AI, bao gồm chi phí cao và cạnh tranh khốc liệt từ các công ty công nghệ lớn.
Bài viết cũng nêu bật kế hoạch của Preferred Networks về việc hợp tác với các đối tác sản xuất chip để thúc đẩy quá trình sản xuất.
Cuối cùng, bài viết kết luận rằng sự phát triển của chip AI riêng biệt có thể mở ra cơ hội mới cho ngành công nghệ AI, đặc biệt là trong lĩnh vực xử lý dữ liệu nhanh chóng và hiệu quả năng lượng.

📌 Preferred Networks của Nhật Bản đang tiến hành phát triển chip AI tùy chỉnh, nhằm giải quyết vấn đề tắc nghẽn và tối ưu hóa hiệu suất xử lý, mở ra cơ hội mới trong ngành công nghệ AI với tập trung vào hiệu quả năng lượng.

Không có file đính kèm.

Nguồn tham khảo

157

AI chips-hardware-compute 2023-12-20 08:19:15

Đối thủ cạnh tranh lớn nhất Trung Quốc của Nvidia trình làng các GPU AI mới tiên tiến - GPU Moore Threads S4000 AI và cụm máy chủ Trung tâm Điện toán Thông minh sử dụng 1.000 GPU AI mới

Nvidia, một trong những công ty hàng đầu thế giới về GPU, đang đối mặt với sự cạnh tranh mạnh mẽ từ đối thủ lớn nhất của họ tại Trung Quốc, khi công ty này công bố GPU AI mới và tiên tiến, Moore Threads S4000.
Moore Threads S4000 được thiết kế đặc biệt cho các ứng dụng AI và máy học, với hiệu suất cạnh tranh và khả năng xử lý dữ liệu tốc độ cao.
Công ty Trung Quốc cũng giới thiệu Trung tâm Tính toán Thông minh, hệ thống máy chủ sử dụng 1000 GPU AI Moore Threads S4000, nhằm tăng cường khả năng xử lý dữ liệu và tính toán.
Sự ra đời của GPU AI Moore Threads S4000 và Trung tâm Tính toán Thông minh hứa hẹn sẽ tạo ra một cuộc cạnh tranh gay gắt trong lĩnh vực GPU AI, đặc biệt là trong việc xử lý dữ liệu lớn và máy học.
Điều này cho thấy sự đổi mới và phát triển mạnh mẽ trong ngành công nghiệp GPU, không chỉ ở Trung Quốc mà còn trên toàn cầu.

🔥 Sự xuất hiện của GPU AI Moore Threads S4000 và Trung tâm Tính toán Thông minh từ đối thủ lớn nhất của Nvidia tại Trung Quốc đánh dấu một bước tiến đáng kể trong lĩnh vực công nghệ. Sự cạnh tranh này không chỉ thúc đẩy đổi mới và phát triển trong ngành GPU mà còn mở ra cánh cửa cho các giải pháp công nghệ tiên tiến, tối ưu hóa xử lý dữ liệu và máy học.

Không có file đính kèm.

Nguồn tham khảo

131

AI chips-hardware-compute 2023-12-19 09:03:09

Cách thức hoạt động của các chip cung cấp sức mạnh cho AI

Công nghệ đằng sau AI tạo ra như ChatGPT đã bùng nổ, thúc đẩy nhu cầu về chip có thể xử lý sức mạnh xử lý mà các chương trình này cần. WSJ đã đến thăm phòng thí nghiệm chip của Amazon để xem những con chip này hoạt động như thế nào và tại sao những gã khổng lồ công nghệ nghĩ rằng chúng là tương lai. Minh họa: John McColgan

Theo

Wall Street Journal

Không có file đính kèm.

Nguồn tham khảo

157

AI chips-hardware-compute 2023-12-18 18:14:53

Trận chiến GPU: NVIDIA vs AMD

- AMD và Nvidia đang cạnh tranh về hiệu năng bộ tăng tốc AI, bắt đầu từ các tuyên bố của AMD rằng GPU MI300X mới của họ vượt trội hơn so với H100 của Nvidia.

- Nvidia đã tranh cãi về phương pháp kiểm tra của AMD và chạy các bài test của riêng họ cho thấy H100 nhanh hơn.

- AMD sau đó đưa ra các bài test mới tuyên bố MI300X nhanh hơn 30% so với H100 khi tối ưu hóa đúng cách.

- Thị trường GPU cho AI đang nóng lên với sự tham gia của nhiều hãng sản xuất chip khác.

- Cuộc cạnh tranh giữa các nhà sản xuất chip là rất khốc liệt để chiếm thị phần.

Kết luận: Cuộc chiến chip AI giữa Nvidia và AMD ngày càng quyết liệt để giành vị trí dẫn đầu.

AMD và Nvidia cạnh tranh sòng phẳng cho vị trí GPU AI số 1

GPU, Nvidia, AMD, bộ xử lý đồ họa, trí tuệ nhân tạo

Cuộc chiến chip AI giữa Nvidia và AMD ngày càng quyết liệt

Không có file đính kèm.

Nguồn tham khảo

133

AI chips-hardware-compute 2023-12-17 19:44:46

Tại sao cuộc chiến công nghệ của Mỹ chống lại Trung Quốc có thể phản tác dụng

- Cuộc chiến công nghệ của Mỹ chống lại Trung Quốc có thể phản tác dụng khi thúc đẩy Trung Quốc phát triển ngành công nghiệp chip độc lập, cạnh tranh trực tiếp với các nhà sản xuất Mỹ.

- Các biện pháp trừng phạt của chính quyền Biden ngăn chặn bán sản phẩm chip tiên tiến cho Trung Quốc, nhằm ngăn chặn quân đội Trung Quốc phát triển vũ khí tối tân.

- Huawei, sau khi bị tổn thương bởi lệnh cấm của Mỹ, đã tái tạo thành công bằng cách chuyển hướng sang điện toán đám mây và tái nhập thị trường di động với Mate 60 sử dụng chip 7 nanomet.

- Trung Quốc đang tiến gần hơn với phương Tây khi ra mắt máy tính chip 5 nanomet, trong khi ASML Hà Lan là công ty duy nhất có thiết bị sản xuất chip 3 nanomet.

- Trung Quốc đang đẩy mạnh giáo dục, với các trường đại học và học sinh của mình đứng đầu thế giới về kỹ thuật và khoa học cơ bản.

- Các công ty Trung Quốc có thể sản xuất sản phẩm giá rẻ hơn và có tiềm năng chiếm lĩnh hạ tầng công nghệ ở các nước phát triển.

- Dù đối mặt với áp lực kinh tế, IMF dự báo tăng trưởng GDP của Trung Quốc là 5,4% cho năm 2023 và 4,6% cho năm 2024.

Kết luận: Mỹ có nguy cơ tự gây hại cho mình trong cuộc chiến công nghệ với Trung Quốc, khi các biện pháp trừng phạt không chỉ không ngăn chặn được sự phát triển của Trung Quốc mà còn kích thích nước này tự lực cánh sinh, đặc biệt là trong lĩnh vực sản xuất chip và công nghệ cao, với dự báo tăng trưởng kinh tế tích cực từ IMF.

Không có file đính kèm.

Nguồn tham khảo

126

AI chips-hardware-compute AI so sánh 2023-12-17 05:39:46

AMD phản công Nvidia bằng điểm chuẩn MI300X mới - MI300X cho thấy hiệu suất cao hơn 30% so với H100, ngay cả với ngăn xếp phần mềm được tối ưu hóa

- AMD ngày càng khẳng định vị thế khi MI300X cho hiệu suất cao hơn 30% so với H100 của Nvidia.

- MI300X sử dụng dataset FP16 trong khi Nvidia sử dụng FP8 với TensorRT-LLM, chỉ tương thích với sản phẩm của hãng.

- AMD đã thực hiện các bài test đối đầu với Nvidia, sử dụng cùng kịch bản kiểm tra và đã tối ưu hóa, nhằm chứng minh hiệu suất ưu việt của MI300X.

- Công ty áp dụng các tối ưu hóa mới và tính toán độ trễ trong khi thử nghiệm, phản ánh môi trường thực tế hơn so với chỉ số thông lượng của Nvidia.

- AMD nhấn mạnh rằng việc chuyển từ FP16 sang FP8 đòi hỏi ngành công nghiệp phải từ bỏ hệ thống nguồn mở vLLM để sử dụng TensorRT-LLM.

Cuộc chiến về hiệu suất giữa AMD và Nvidia tiếp tục nóng lên với việc AMD tung ra MI300X, với hiệu suất vượt trội 30% so với H100 của Nvidia. Sự cạnh tranh không chỉ dừng lại ở con số mà còn ở việc sử dụng các chuẩn dữ liệu và kịch bản kiểm tra, nơi AMD đã chứng minh được ưu điểm vượt trội của mình thông qua việc tối ưu hóa và tính toán độ trễ.

Không có file đính kèm.

Nguồn tham khảo

150

AI chips-hardware-compute 2023-12-15 14:10:04

Intel 'Emerald Rapids' Đánh giá Xeon Platinum 8592+ thế hệ thứ 5: 64 lõi, bộ nhớ đệm L3 gấp ba lần và bộ nhớ nhanh hơn mang lại hiệu suất AI ấn tượng

- Tóm tắt nội dung bài đánh giá CPU Intel Xeon Platinum 8592+ Emerald Rapids:

- CPU 64 lõi, 128 luồng, xung nhịp 1.9 - 3.9 GHz, 320MB bộ nhớ đệm L3.

- Sử dụng tiến trình Intel 7, kiến trúc Raptor Cove, hỗ trợ RAM DDR5-5600.

- Tăng gấp 3 lượng bộ nhớ đệm so với thế hệ trước, tốc độ RAM nhanh hơn.

- Hiệu năng tổng thể tăng 21%, AI tăng 42% so với thế hệ Sapphire Rapids.

- Vượt trội so với AMD EPYC Genoa ở các tác vụ AI và đa luồng.

- Giá 1199$, cạnh tranh với AMD trong thị trường máy chủ.

Không có file đính kèm.

Nguồn tham khảo

111

12,345 Fans 12,345 Followers 12,345 Subscribers

Tin phổ biến

AI coding assistant

Cursor AI - IDE thay thế VS Code với trợ lý AI tích hợp

AI giáo dục

UNESCO ra mắt 2 khung năng lực AI mới cho học sinh và giáo viên

AI giáo dục

Khung năng lực AI cho giáo viên của UNESCO

AI so sánh

OpenAI hay tự xây dựng: so sánh chi phí thực tế của việc tự lưu trữ các mô hình ngôn ngữ lớn

Apple joins AI fray with release of model framework

The AI skills gap is becoming incredibly troubling for companies everywhere

AI doanh nghiệp

10 use-case hàng đầu của AI trong kinh doanh

AI so sánh

Phân tích chuyên sâu về RAG, AI Agents và Agentic RAG

AI kiến thức-khóa học

Hướng dẫn toàn diện về lập trình AI với Cursor cho người mới bắt đầu

The AI Frenzy, Fed Meets, Hunter Biden: Your Sunday US Briefing

TAG

AI giáo dục AI sinh-y-duoc AI nghệ thuật AI pháp lý-quản trị-chủ quyền AI models AI xã hội AI prompts AI kiến thức-khóa học AI công nghiệp-lĩnh vực AI edge AI viễn thông AI tools AI chính phủ AI cybersecurity AI so sánh AI đạo đức AI tips AI market AI quân sự AI an toàn-an ninh-techwar AI việc làm AI doanh nghiệp OpenAI ChatGPT AI môi trường-năng lượng AI skill-talent AI & công nghệ khác AI nghiên cứu AI chips-hardware-compute AI vs con người AI coding assistant AI mở-nguồn mở AI năng suất AI startup-M&A AI tương lai AI báo chí AI data AI bản quyền AI PC AI riêng tư AI deepfake-ảo giác-ANTT AI ảnh-video-music-âm thanh AI minh bạch AI nhỏ AI nông nghiệp-thực phẩm AI ngân hàng-tài chính AI giao thông AI smartphone AI robotics-auto-agents AI consumer devices AI manufacturing AI benchmark Telecom AI thành công-thất bại Digital Semi-Cloud-DC-Green HTS STI FAQ

SongAI

AI chips-hardware-compute

China mandates more domestic AI chips for data centres to cut reliance on Nvidia

Beijing puts pressure on Chinese tech giants over purchases of Nvidia’s H20 chips

How more efficient data centres could unlock the AI boom

How AI ‘hyperscalers’ are boosting data centre efficiency

Leashing Chinese AI Needs Smart Chip Controls

Firms don’t want Huawei’s domestically produced alternatives—but might have no choice.

Silicon Valley’s New Strategy: Move Slow and Build Things

Big tech companies are becoming infrastructure companies—just like the steel and railroad giants of old

China has top-flight AI models. But it is struggling to run them

Trump’s U-turn on chip-export controls could be a boon

South-East Asia makes an AI power grab

No other region is as appealing to both America and China

SK Hynix to Boost Investment After Record Results on Strong AI Chip Demand

The company expects brisk HBM demand to continue through 2025

How easing of AI chip controls could reshape US-China trade talks

ASML Says Easing China AI Chip Controls Would Boost Demand

Nvidia gets nod from Washington to resume sales of H20 China chip

Meet Nvidia’s big new customers: governments

But will “sovereign” AI pay off for taxpayers?

Temasek to increase exposure in AI, core-plus infrastructure

Navene Elangovan

Core-plus infrastructure

Huawei Seeks AI Chip Customers in Middle East, Southeast Asia

📌

📌

High-priced drones and Japan’s hidden AI champion

Drone-flation

Essential threads

Low altitude, lofty ambitions

Double talk

How Huawei’s silicon strategy defies US sanctions to advance China’s AI ambitions

US export controls on AI chips are backfiring

Chinese AI Companies Dodge U.S. Chip Curbs by Flying Suitcases of Hard Drives Abroad

Engineers carry data to countries where Nvidia chips are available, frustrating Washington’s aims

China's critical mineral curbs shake AI data center suppliers

Top trade representatives from the two countries met in London this week to discuss the trade situation and announced on Tuesday that they had reached a "framework" agreement involving critical minerals and chips. Few details were given, however.

Beyond 1s and 0s: China starts mass production of world’s first non-binary AI chip

Why Nvidia Can’t Just Quit China

Despite booming demand elsewhere, growth would still be hindered without world’s second-largest economy

SHARE YOUR THOUGHTS

The U.S. Plan to Hobble China Tech Isn’t Working

Chinese solar panels, electric vehicles and drones are better than those made in the U.S. Is AI next?

Chips ahoy

Trump’s first term

Why China?

Nvidia builds new AI chip for China with powerful computing cluster capabilities: report

Tại sao Trung Quốc đấu tranh mạnh mẽ chống lại lệnh cấm chip mới của Mỹ – và liệu điều này có hiệu quả?

Why is China fighting so hard against the US’ new chip ban – and will it work?

Trung Quốc vẫn đang lấy được thiết bị của Nvidia như thế nào

Bên trong ngành kinh doanh buôn lậu chip AI đầy bí ẩn

Chip đã ra khơi

How China is still getting its hands on Nvidia’s gear

Inside the shadowy business of AI-chip smuggling

The chip has sailed

CEO Nvidia nói rằng tất cả các công ty sẽ cần 'Nhà máy AI,' ca ngợi việc tạo ra việc làm cho người Mỹ

Chi phí tính toán: Cuộc đua 7.000 tỷ đô la để mở rộng quy mô trung tâm dữ liệu

Side bar: Còn các tải công việc không phải AI thì sao?

Còn các tải công việc không phải AI thì sao?

Dự đoán đường cong nhu cầu sức mạnh tính toán

Chỉ riêng nhu cầu AI sẽ cần 5.200 tỷ đô la đầu tư

Quy mô đầu tư

Side Bar: Phương pháp luận

Đầu tư đang đi đâu?

Side bar: 5 loại nhà đầu tư trung tâm dữ liệu

5 nguyên mẫu nhà đầu tư cơ sở hạ tầng AI

1. Nhà xây dựng

2. Nhà cung cấp năng lượng

3. Nhà phát triển và thiết kế công nghệ

4. Nhà vận hành

5. Kiến trúc sư AI

Những cân nhắc quan trọng cho tăng trưởng cơ sở hạ tầng AI

Cuộc đua cho lợi thế cạnh tranh

China's AI growth will be 'largely unaffected' by chip export rules, analysts say

How Chinese AI progressed despite chip limits

Nvidia CEO vận động Nhật Bản cung cấp thêm điện, trung tâm dữ liệu để phát triển AI

Nvidia CEO Lobbies Japan for More Power, Data Centers to Fuel AI

TDK tuyên bố đột phá quang học để giải quyết nút thắt lớn nhất của AI tạo sinh

TDK claims optical breakthrough to tackle generative AI’s biggest bottleneck