එන්වීඩීඅයි ඩීජීඑක්ස් ස්පාක් — පොතක ප්‍රමාණයේ උපකරණයක් වන අතර, එය බිලියන 200 ක පරාමිති ඇති AI ආකෘති (බිලියන 400 ක් වන අවස්ථාවේදී දෙකක් සම්බන්ධ කළ විට) ධාවනය කිරීමට සමත් වේ — මෙය ඩෙස්ක්ටොප් AI අයිතියේ නව යුගය නියෝජනය කරයි.

1 පදනම
ඇයි ස්ථානීය AI? හිමිකාරිත්වය සඳහා ව්‍යාපාරික අවශ්‍යතා

2020 ගණන්වල මුල් භාගයේදී, කෘතිම බුද්ධිය ඔබ විසින් බද්දට ගත් සේවාවක් විය — පැයට, ටෝකනයට, API ඇමතුමට. 2026 වන විට, රටාව වෙනස් වී ඇත. GPT-4 පන්තියේ බුද්ධිමත්භාවය ධාවනය කිරීමට අවශ්‍ය දෘඩාංග දැන් ඔබේ මේසය මත ගැළපෙන අතර භාවිතා කළ මෝටර් රථයකට වඩා අඩු වියදමකි.

වලාකුළු පමණක් වන AI මත අඛණ්ඩ යැපීම උපායමාර්ගික ත්‍රිදුඃඛයක් ඉදිරිපත් කරයි:

  • වැඩිවන වියදම්. ටෝකනයකට API ගාස්තු භාවිතය සමඟ රේඛීයව පරිමාණනය වේ. දිනකට ගිවිසුම් 1,000 ක් සකසන නීති සමාගමකට වාර්ෂික API පිරිවැයෙන් ~රු. 1.11 කෝටි කට මුහුණ දිය හැකිය.
  • දත්ත නිරාවරණය. වලාකුළු API එකකට යවන එක් එක් විමසුම ඔබේ ජාලයෙන් පිටවන දත්ත වන අතර දත්ත ආරක්ෂාව හා පෞද්ගලිකත්ව අවදානම්වලට යටත් වේ.
  • ශුන්‍ය හෝ වියදම් අධික අභිරුචිකරණය. වලාකුළු ආකෘති සාමාන්‍ය වේ. ඒවා අභිරුචි දත්ත, අභ්‍යන්තර ව්‍යාපාර ක්‍රියාවලි, හෝ ව්‍යාපාර බුද්ධිය මත පහසුවෙන් හෝ පිරිවැය-කාර්යක්ෂමව සුක්ෂම කළ නොහැක.

ස්ථානීය AI දෘඩාංග මේ තුනම විසඳයි. එය විචල්‍ය API ගාස්තු ස්ථාවර ප්‍රාග්ධන වත්කමක් බවට පරිවර්තනය කරයි, දත්ත කිසි විටෙක LAN හි ඉවත් නොවන බවට සහතික කරයි, සහ ව්‍යාපාර දත්ත මත සුක්ෂම කිරීම හරහා ගැඹුරු අභිරුචිකරණය සක්‍රීය කරයි.

2 වියදම් අඩු කිරීම
ක්වෑන්ටීකරණය: ලාභයෙන් අඩු දෘඩාංග මත විශාල AI ආකෘති ධාවනය කරන්න

ක්වෑන්ටීකරණය යනු ස්ථානීය AI හි ආර්ථික විද්‍යාව මූලිකවම වෙනස් කරන සංකල්පයකි.

සරලව කිවහොත්, ක්වෑන්ටීකරණය AI ආකෘතියක මතක පරිභෝජනය හැකිලීමයි. සම්මත ආකෘතියක් සෑම පරාමිතියක්ම 16-බිට් පාවෙන ලක්ෂ්‍ය අංකයක් (FP16) ලෙස ගබඩා කරයි. ක්වෑන්ටීකරණය මෙය 8-බිට් (Int8), 4-බිට් (Int4), හෝ ඊටත් වඩා අඩු කරයි — ආකෘතිය ධාවනය කිරීමට අවශ්‍ය මතක ප්‍රමාණය නාටකීය ලෙස අඩු කරයි.

ක්වෑන්ටීකරණය ප්‍රතිදාන ගුණාත්මකභාවය තරමක් අඩු කරයි — බොහෝ විට සාරාංශ කිරීම, කෙටුම්පත් සකස් කිරීම සහ විශ්ලේෂණය වැනි ව්‍යාපාර කාර්යයන් සඳහා නොදැනෙන තරම් — දෘඩාංග වියදම් විශාල ලෙස අඩු කිරීමක් වෙනුවෙන්.

අවශ්‍ය මතකය: විවිධ නිරවද්‍යතා මට්ටම්වල 400B AI ආකෘතිය
FP16
සම්පූර්ණ නිරවද්‍යතාව
~800 GB
Int8
අඩක ප්‍රමාණය
~400 GB
Int4
සිව්වන කොටස
~200 GB
FP16 — උපරිම ගුණාත්මකභාවය, උපරිම වියදම
Int8 — ආසන්න-පරිපූර්ණ ගුණාත්මකභාවය, වියදමෙන් අඩක්
Int4 — උසස් ගුණාත්මකභාවය, වියදමෙන් සිව්වන කොටස
ව්‍යාපාරික බලපෑම

සම්පූර්ණ නිරවද්‍යතාවයෙන් යුත් 400B ආකෘතියකට ~800 GB මතකයක් අවශ්‍ය වේ — එය ~රු. 6.2 කෝටි සේවාදායක ආයෝජනයකි. එම ආකෘතියම Int4 දක්වා ක්වෑන්ටයිසේෂන් කිරීමෙන් පසු ~200 GB පමණක් අවශ්‍ය වන අතර, එය සම්බන්ධ කරන ලද DGX Spark (GB10 සුපර්චිප් මත පදනම් වූ) මිනි-පීසී දෙකක් මත ~රු. 24.6 ලක්ෂ කට ධාවනය කළ හැකිය.

විශේෂඥ මිශ්‍රණය ()

විශේෂඥයින්ගේ මිශ්‍රණය යනු තවත් AI ආකෘති ගෘහනිර්මාණ ශිල්ප ක්‍රමයක් වන අතර, එය අති විශාල මතක පිරිවැයකින් තොරව විශාල ආකෘති යෙදීමට හැකි කරයි.

සෑම ප්‍රශ්නයක් සඳහාම සියලු පරාමිති භාවිතා කිරීම වෙනුවට, MoE ආකෘතියක් එහි ධාරිතාවයෙන් කොටසක් පමණක් විරල සක්‍රිය කිරීම හරහා සක්‍රිය කරයි.

ට්‍රිලියන 2 ක පරාමිති ඇති MoE ආකෘතියක් (Llama 4 Behemoth වැනි) විමසුමකට පරාමිති 288B ක් පමණක් සක්‍රිය කරයි — මතක පිරිවැයෙන් කොටසක් වියදම් කරමින් මූලික මට්ටමේ බමත්භාවය සපයයි.

විකල්පය

MoE ආකෘති සමාන ප්‍රමාණයේ ඝන ආකෘති සමඟ සසඳන විට සරල කාර්යයන්හිදී (සාරාංශකරණය හා වර්ගීකරණය වැනි) තරමක අඩු කාර්යක්ෂමතාවකෙන්වයි. කෙසේවෙතත්, දැනුම් කාර්යයන් සහ තර්කනයන් සඳහා (සංකීර්ණ විශ්ලේෂණය, කේත ජනනය සහ පර්යේෂණය වැනි) MoE ආකෘති විශිෂ්ඨ වේ.

විරල සක්‍රිය කිරීම වේගවත් අනුමාන වේගය සහ වේගවත් ප්‍රතිචාර කාලයන්හට හේතු වේ.

3 මිනි-PC
AI මිනි-PC රු. 4.6 ලක්ෂ - රු. 30.8 ලක්ෂ

කාන්තාවකගේ අතෙහි HP ZGX Nano AI

2026 දී වඩාත් බිඳහෙලන සංවර්ධනය වන්නේ මිනි-PC හැඩතලය තුළ අධි-සාමර්ථය AI පරිගණක කිරීමයි. දැන් ග්‍රන්ථයකට වඩා විශාල නොවන උපාංග වසර දෙකකට පෙර සේවාදායක කාමර අවශ්‍ය කළ AI ආකෘති ධාවනය කරයි.

NVIDIA GB10 පරිසරය (DGX Spark)

කාර්ය සාධන නායකයා

NVIDIA logo

NVIDIA DGX Spark මෙම කාණ්ඩය නිර්වචනය කර ඇත. 2026 දී, ARM Grace CPU එකක් Blackwell GPU එකක් සමඟ ඒකාබද්ධ කරන GB10 සුපර්චිප් එක සම්පූර්ණ පරිසරයක් බිහි කර ඇත. ASUS, GIGABYTE, Dell, Lenovo, HP, MSI, සහ Supermicro සියල්ලම GB10-පාදක පද්ධති නිෂ්පාදනය කරයි, එක් එක් විවිධ හැඩතල, සිසිලන විසඳුම් සහ බන්ධනගත මෘදුකාංග සමඟ.

NVIDIA GB10 පරිසරය ASUS, GIGABYTE, Dell Lenovo, HP, MSI, සහ Supermicro
සිට රු. 12.3 ලක්ෂ
මතකය
128 GB
LPDDR5X ඒකාබද්ධ
ගණනය කිරීම
~1 PFLOP
FP8 AI කාර්ය සාධනය
ජාලකරණය
10 GbE + Wi-Fi 7
ක්ලස්ටරින් සඳහා ConnectX
ගබඩා කිරීම
4 TB SSD
NVMe
ක්ලස්ටරින්
ඔව් (ඒකක 2)
256 GB එකතු කළ මතකය
මෘදුකාංග
NVIDIA AI Enterprise
CUDA, cuDNN, TensorRT
NVIDIA DGX Spark
ASUS Ascent GX10
Gigabyte AI TOP ATOM
DGX Quantum Machines combo
MSI EdgeExpert
Lenovo ThinkStation PGX
Dell Pro Max Desktop
NVIDEA DGX Spark
ක්ලස්ටරින්: 256 GB ධාරිතාව

සමර්පිත අධි-වේග ජාල වරාය හහා GB10 ඒකක දෙකක් සම්බන්ධ කිරීමෙන්, පද්ධතිය සම්පත් 256 GB මතක අවකාශයකට එකතු කරයි. මෙය ඔබේ මේසය මතම ඉතා විශාල ආකෘති — පරාමිති 400B+ ක්වෑන්ටීකරණය කරන ලද — ධාවනය කිරීමේ හැකියාව අගුළු ඇරයි, ආසන්න වශයෙන් ~රු. 24.6 ලක්ෂ සම්පූර්ණ දෘඩාංග ආයෝජනයක් සඳහා.

AMD Ryzen AI Max (Strix Halo) මිනි-PC

අඩුම වියදම

AMD Ryzen AI Max+ Strix Halo

AMD හි Ryzen AI Max+ Strix Halo ගෘහනිර්මාණ ශිල්පය බජට් AI මිනි-PC නව කාණ්ඩයක් බිහි කර ඇත. නිෂ්පාදකයින්ගේ තරංගයක් — GMKtec, Beelink, Corsair, NIMO, Bosgame, FAVM — දැන් ~රු. 6.2 ලක්ෂ යටතේ මතකය GB 128 ක් ඒකාබද්ධ කරන පද්ධති නැව්ගත කරයි.

AMD Ryzen AI Max මිනි-PC GMKtec EVO-X2 · Beelink · Corsair · NIMO AI · Bosgame M5 · FAVM FA-EX9
සිට ~රු. 4.6 ලක්ෂ
මතකය
128 GB
LPDDR5 බෙදාගත් (CPU+GPU)
ගණනය කිරීම
~0.2 PFLOP
ඒකාබද්ධ RDNA 3.5 GPU
පළල
~200 GB/s
මතක පළල
බලය
~100W
නිශ්ශබ්ද ක්‍රියාකාරිත්වය
ක්ලස්ටරින්
නැත
ස්වාධීන පමණි
OS
Windows / Linux
ROCm / llama.cpp
GMKtex EVO X2
Bosgame M5 AI
NIMO AI Mini PC
Beelink Mini PC
Beelink Mini PC
Corsair AI Workstation 300 Halo
FAVM FA EX9
GMK Ryzen Strix Halo Mini PC

Apple Mac Studio (M4 Ultra)

ධාරිතා නායකයා

Mac Studio ස්ථානීය AI භූ දර්ශනයේ අද්විතීය ස්ථානයක් ගනී. Apple හි ඒකාබද්ධ මතක ගෘහනිර්මාණ ශිල්පය (UMA) CPU සහ GPU දෙකටම ප්‍රවේශ විය හැකි මතකය GB 256 ක් දක්වා තනි, සංයුක්ත ඩෙස්ක්ටොප් ඒකකයක් ලබා දෙයි — ක්ලස්ටරින් අවශ්‍ය නොවේ.

මෙය එය විශාලතම විවෘත-මූලාශ්‍ර ආකෘති පූරණය කිරීමට සමත් එකම ජනප්‍රිය තනි උපාංගය කරයි. Int4 දක්වා ක්වෑන්ටීකරණය කරන ලද බිලියන 400 ක පරාමිති ආකෘතියක් මතකය GB 256 ක වින්‍යාසයෙන් සම්පූර්ණයෙන්ම ගැළපේ.

Apple Mac Studio (M4 Ultra) තනි-ඒකක AI ධාරිතා නායකයා
සිට රු. 12.3 ලක්ෂ
මතකය
මතකය GB 256 දක්වා
ඒකාබද්ධ මතකය (UMA)
ගණනය කිරීම
~0.5 PFLOP
Apple ස්නායු එන්ජිම + GPU
මෘදුකාංග
MLX රාමුව
Apple-ප්‍රශස්තිකරණය කළ අනුමානය
සීමාව
අනුමානය පමණි
පුහුණු කිරීම/සුක්ෂම කිරීම සඳහා සෙමින්

Apple Mac Studio (M5 Ultra)

ඉදිරි අභියෝගකරු

2026 අවසානයේ බලාපොරොත්තු වන Apple හි ඊළඟ පරම්පරාවේ M5 Ultra, M4 හි ප්‍රාථමික දුර්වලතාව විසඳනු ඇතැයි පැතිර යයි: AI ආකෘති පුහුණු කාර්ය සාධනය. TSMC හි 2nm ක්‍රියාවලිය මත ගොඩනගා ඇති එය, පළල GB/s 1.2 ඉක්මවන මතකය GB 512 ක් දක්වා වින්‍යාස ලබා දීමට බලාපොරොත්තු වේ.

Apple Mac Studio (M5 Ultra) බලාපොරොත්තු වන AI පුහුණු බලාගාරය
ඇස්. ~රු. 37 ලක්ෂ
මතකය
මතකය GB 512 දක්වා
ඊළඟ පරම්පරාවේ ඒකාබද්ධ මතකය
ගණනය කිරීම
~1.5+ PFLOP
2nm ස්නායු එන්ජිම
මෘදුකාංග
MLX 2.0+
ස්වදේශීය පුහුණු සහාය
හැකියාව
පුහුණු කිරීම සහ අනුමානය
CUDA-විකල්පය
මතක පළල: ධාරිතාව GB/s 1.2

මතකය GB 512 ක M5 Ultra යනු අක්වෑන්ටීකරණය කළ (සම්පූර්ණ නිරවද්‍යතාව) මායිම් ආකෘති ධාවනය කිරීමට සමත් පළමු පාරිභෝගික උපාංගය වනු ඇත. GB/s 1.2+ හි ඉහළ මතක පළල ඉතා දිගු සන්දර්භ කවුළු සමඟ අඛණ්ඩ අධි-ප්‍රවාහ අනුමානය අවශ්‍ය කරන ඒජන්ට් AI ක්‍රියාවලි සඳහා සහාය දක්වයි.

ටයිනි AI

පොකට් AI සුපර් කම්පියුටරය

Tiiny AI

2026 දී Kickstarter මත රු. 4.3 ලක්ෂ කට නිකුත් කරන ලද Tiiny.ai පොකට් AI පරිගණකය, 80GB LGDDR5X මතකයක් සහ 1TB SSD එකක් සහිත පොකට් සුපර් කම්පියුටරයක් වන අතර, එය ඕනෑම තැනක දේශීයව 120B AI ආකෘති ධාවනය කිරීමට සහාය වේ.

ග්‍රෑම් 300 (142×22×80mm) බරින් යුක්ත වන අතර සම්මත USB-C මගින් බල ගැන්වෙන මෙය නවෝත්පාදන ව්‍යාපාරික යෙදුම් සඳහා සහාය වේ. ටයිනි AI වාර්තා කරන්නේ GPT-OSS-120B සඳහා තත්පරයට ටෝකන 21.14 ක ප්‍රතිදාන වේගයකි.

Tiiny Pocket AI Computer
Tiiny Pocket AI Computer
Tiiny Pocket AI Computer
Tiiny Pocket AI Computer

Tenstorrent

විවෘත මූලාශ්‍ර දෘඩාංග

Tenstorrent

ප්‍රසිද්ධ චිප් ගෘහනිර්මාණ ශිල්පී Jim Keller ගේ නායකත්වයෙන් යුතුව, Tenstorrent මූලිකවම වෙනස් දර්ශනයක් නියෝජනය කරයි: RISC-V මත ගොඩනගා ඇති විවෘත-මූලාශ්‍ර දෘඩාංග, විවෘත-මූලාශ්‍ර මෘදුකාංග, සහ ඩේසි-සැකසීම හරහා මොඩියුලර් පරිමාණය.

Tensix AI හරයන් රඛීයව පරිමාණය කිරීම සඳහා නිර්මාණය කර ඇත: GPU වලට වඩා, ඔබ වැඩි කාඩ්පත් එකතු කරන විට සන්නිවේදන අධිභාරය සමඟ අපහසුතා ඇති වන, Tenstorrent චිප් කාර්යක්ෂමව ටයිල් කිරීම සඳහා ගොඩනගා ඇත.

Razer සමඟ සහයෝගීතාවයෙන්, Tenstorrent ඕනෑම ලැප්ටොප් හෝ ඩෙස්ක්ටොප් එකකට Thunderbolt හරහා සම්බන්ධ වන සංයුක්ත බාහිර AI ත්වරකයක් නිකුත් කර ඇත — දෙයක් ප්‍රතිස්ථාපනය නොකර ඇති දෘඩාංග AI වැඩස්ථානයක් බවට පරිවර්තනය කරයි.

Razer × Tenstorrent සංයුක්ත AI ත්වරකය බාහිර Thunderbolt AI ත්වරකය
මිල නොදනී
කොටුවකට මතකය
12 GB
GDDR6
චිප්
Wormhole n150
Tensix හරයන් · RISC-V
පරිමාණය
ඒකක 4 දක්වා
48 GB AI ධාරිතාව
මෘදුකාංග
සම්පූර්ණයෙන්ම විවෘත මූලාශ්‍ර
GitHub · TT-Metalium
Razer × Tenstorrent AI Accelerator
Razer × Tenstorrent AI Accelerator
Razer × Tenstorrent AI Accelerator
Razer × Tenstorrent AI Accelerator

AI NAS — ජාලයට සම්බන්ධ ගබඩාව

ගබඩාව + AI

NAS හි නිර්වචනය නිෂ්ක්‍රීය ගබඩාවෙන් සක්‍රීය බුද්ධිමත්භාවය දක්වා මාරු වී ඇත. ජාල ගබඩා උපාංගවල නව පරම්පරාව AI සැකසීම සෘජුවම ඒකාබද්ධ කරයි — සැහැල්ලු NPU-පාදක අනුමානයේ සිට සම්පූර්ණ GPU-වේගවත් LLM පිරිනැමීම දක්වා.

AI-හැකියාවෙන් යුත් NAS එකක් වෙනම AI උපාංගයක අවශ්‍යතාවය ඉවත් කරන අතර ජාල හුවමාරු ප්‍රමාදයකින් තොරව විශාල දත්ත ප්‍රමාණයක් සෘජුවම සැකසීමට ඉඩ සලසයි.

QNAP AI NAS
Ugreen DXP4800 Pro
OmniCore AI NAS
Zetlab AI NAS

ඔබේ ව්‍යාපාරය සඳහා සුදුසු AI මිනි-PC එක තෝරා ගැනීමට උදව් අවශ්‍යද?

අපගේ ඉංජිනේරුවන්ට ඔබේ AI දෘඩාංග අවශ්‍යතා තක්සේරු කිරීමට සහ සම්පූර්ණයෙන් වින්‍යාසගත කරන ලද AI පද්ධතියක් ස්ථාපනය කිරීමට හැකියාව ඇත.

නොමිලේ දෘඩාංග තක්සේරුවක් ලබා ගන්න →

4 වැඩස්ථාන
AI වැඩස්ථාන සහ ඩෙස්ක්ටොප් PC රු. 9.2 ලක්ෂ - රු. 46.2 ලක්ෂ

වැඩස්ථාන මට්ටම වෙනස් PCIe ග්‍රැෆික් කාඩ්පත් සහ සම්මත කුළුණු ශරීර භාවිතා කරයි. මිනි-PC මට්ටමේ ස්ථාවර ඒකාබද්ධ ගෘහනිර්මාණ ශිල්පයට වඩා මෙම මට්ටම මලර් ගතිය ලබා දෙයි - තාක්ෂණය පරිණාමය වන විට ඔබට තනි අංග උසස් කිරට, තවත් GPU එකතු කිරීමට හෝ කාඩ්පත් මාරු කිරීමට හැකිය.

NVLink පාලමක් සහිත ද්විත්ව RTX A6000 වැඩස්ථානයක් ආසන්න වශයෙන් රු. 21.6 ලක්ෂ ක් වන විට 96 GB එකතු කළ VRAM පිරිවැයකින් ලබා දෙයි.

VRAM එදිරිව වේගය අවබෝධ කර ගැනීම

AI සඳහා GPU තේරීම අර්ථ දක්වන තරඟකාරී සාධක දෙකක් ඇත:

📦
VRAM ධාරිතාව
ඔබට පූරණය කළ හැකි ආකෘතියේ ප්‍රමාණය තීරණය කරයි. වැඩි VRAM යනු විශාල, වැඩි හැකියාවන් සහිත ආකෘති යන්නයි. මෙය ඔබේ බුද්ධිමත් භාවයේ උපරිමයයි.
ගණනය කිරීමේ වේගය
ආකෘතිය ප්‍රතික්‍රියා කරන වේගය තීරණය කරයි. ඉහළ ගණනය කිරීමේ ශක්තිය යනු විමසුමකට අඩු ප්‍රමාදයක් යන්නයි. මෙය ඔබේ පරිශීලක අත්දැකීමයි.

සාමාන්‍ය පාරිභෝගික කාඩ්පත් (RTX 5090 වැනි) වේගය උපරිම කරයි නමුත් සීමිත VRAM ලබා දෙයි - සාමාන්‍යයෙන් 24–32 GB. වෘත්තීය කාඩ්පත් (RTX PRO 6000 Blackwell වැනි) VRAM උපරිම කරයි - කාඩ්පතකට GB 96ක් දක්වා - නමුත් ගණනය කිරීමේ ඒකකයකට වැඩි පිරිවැයක් ගනී.

VRAM යනු බැඳී ඇති සීමාවයි. ප්‍රමාණවත් මතකයක් නොමැතිව වේගවත් කාඩ්පතකට AI ආකෘතිය පූරණය කළ නොහැක. ප්‍රමාණවත් මතකයක් සහිත මන්දගාමී කාඩ්පතක් ආකෘතිය ක්‍රියාත්මක කරයි - නමුත් දිගු ප්‍රතිචාර කාල සමඟ.

පාරිභෝගික GPU

වින්‍යාසයසම්පූර්ණ VRAMසම්බන්ධ කිරීමඇස්ත. පිරිවැය
2× RTX 3090 (පාවිච්චි කළ)48 GBNVLinkරු. 9.2 ලක්ෂ
2× RTX 409048 GBPCIe Gen 5රු. 12.3 ලක්ෂ
2× RTX 509064 GBPCIe Gen 5රු. 21.6 ලක්ෂ

වෘත්තීය GPU

වින්‍යාසයසම්පූර්ණ VRAMසම්බන්ධ කිරීමඇස්ත. පිරිවැය
2× RTX 6000 Ada96 GBPCIe Gen 5රු. 40 ලක්ෂ
1× RTX PRO 6000 Blackwell96 GBNVLink~රු. 24.6 ලක්ෂ
4× RTX PRO 6000 Blackwell384 GBPCIe Gen 5රු. 98.6 ලක්ෂ

දත්ත කේන්ද්‍ර GPU

වින්‍යාසයසම්පූර්ණ VRAMසම්බන්ධ කිරීමඇස්ත. පිරිවැය
1× L40S48 GBPCIe 4.0 (නිෂ්ක්‍රීය සිසිලනය)රු. 21.6 ලක්ෂ
1× A100 PCIe80 GBPCIe 4.0රු. 30.8 ලක්ෂ
1× H200 NVL141 GBNVLinkරු. 92.4 ලක්ෂ
4× H200 NVL564 GBNVLinkරු. 3.7 කෝටි
1× B200 SXM180 GBNVLink 5 (1.8 TB/s)රු. 92.4 ලක්ෂ
8× B200 SXM1,440 GBNVLink 5 (1.8 TB/s)රු. 7.4 කෝටි

චීන GPU

චීනයේ දේශීය GPU පරිසර පද්ධතිය වේගයෙන් පරිණත වී ඇත. චීන නිෂ්පාදක කිහිප දෙනෙක් දැන් තරඟකාරී පිරිවිතර සහ සැලකිය යුතු ලෙස අඩු මිලකට වැඩස්ථාන-පන්ති AI GPU ලබා දෙයි.

වින්‍යාසයසම්පූර්ණ VRAMමතක වර්ගයඇස්ත. පිරිවැය
1× Moore Threads MTT S400048 GBGDDR6රු. 2.5 ලක්ෂ
4× Moore Threads MTT S4000192 GBGDDR6රු. 10.8 ලක්ෂ
8× Moore Threads MTT S4000384 GBGDDR6රු. 20 ලක්ෂ
1× Hygon DCU Z10032 GBHBM2රු. 7.7 ලක්ෂ
1× Biren BR10432 GBHBM2eරු. 9.2 ලක්ෂ
8× Biren BR104256 GBHBM2eරු. 73.9 ලක්ෂ
1× Huawei Ascend Atlas 300I Duo96 GBHBM2eරු. 3.7 ලක්ෂ
8× Huawei Ascend Atlas 300I Duo768 GBHBM2eරු. 30.8 ලක්ෂ

ඉදිරියේදී

වින්‍යාසයසම්පූර්ණ VRAMතත්ත්වයඇස්ත. පිරිවැය
RTX 5090 128 GB128 GBචීන වෙනස් කිරීම — සම්මත SKU එකක් නොවේරු. 15.4 ලක්ෂ
RTX Titan AI64 GB2027 දී අපේක්ෂිතයිරු. 9.2 ලක්ෂ
4x NVIDIA RTX PRO 6000 Blackwell
4x NVIDIA RTX PRO 6000 Blackwell
MSI NVIDIA RTX PRO 6000 Blackwell Server
NVIDIA RTX 5090
NVIDIA DGX Station — සම්මත බිත්ති සොකට්ටුවකට සම්බන්ධ වන ජල-සිසිලනය වන "වගුවක් මත දත්ත කේන්ද්‍රය".

NVIDIA DGX Station

ව්‍යවසාය Apex

NVIDIA DGX Station යනු ජල-සිසිලනය වන, අසල්වැසි සුපර් පරිගණකයක් වන අතර එය දත්ත කේන්ද්‍ර කාර්ය සාධනය කාර්යාල පරිසරයකට ගෙන එයි. නවතම අනුවාදය GB300 Grace Blackwell Superchip භාවිතා කරයි.

NVIDIA DGX Station GB300 අනාගත-සාක්ෂි Ultra
ඇස්ත. මිල ~රු. 6.2 කෝටි

Blackwell Ultra අනුවාදය මතක ඝනත්වය සහ ගණනය කිරීමේ බලය වැඩි කරයි, එය අභිමත ආකෘති ආරම්භයේ සිට පුහුණු කිරීමට හෝ විශාල MoE (Mixture of Experts) ගෘහනිර්මාණ ශිල්ප ප්‍රාදේශීයව ක්‍රියාත්මක කිරීමට අවශ්‍ය සංවිධාන සඳහා නිර්මාණය කර ඇත.

මතකය
~1.5 TB+
HBM3e (අතිශය වේගවත්)
ගණනය කිරීම
~20+ PFLOPS
FP8 AI කාර්ය සාධනය
භාවිතා අවස්ථාව
අභිරුචි පුහුණුව
ආකෘති සංවර්ධනය
බලය
සම්මත සොකට්ටුව
සර්වර් කාමරයක් අවශ්‍ය නැත
NVIDIA DGX Station GB300 Blackwell Ultra
ASUS ExpertCenter Pro DGX GB300
MSI XpertStation WS300
NVIDIA DGX Station GB300 Blackwell Ultra
NVIDIA DGX Station A100 ප්‍රවේශ විය හැකි AI වැඩ යෝධයා
සිට ~රු. 3.1 කෝටි

පෙර පරම්පරාවේ ඇම්පියර් ගෘහනිර්මාණ ශිල්පය මත පදනම් වුවද, එය විශ්වසනීය අනුමාන සහ සුක්ෂම සීරුමාරු කිරීම් සඳහා කර්මාන්ත ප්‍රමිතිය ලෙස පවතී. බ්ලැක්වෙල් සඳහා අයවැයක් නොමැතිව AI අවකාශයට ඇතුළු වන කණ්ඩායම් සඳහා ඉතා සුදුසුය.

මතකය
320 GB
4x 80GB A100 GPU
ගණනය කිරීම
2 PFLO
FP16 AI කාර්ය සාධනය
බහු-පරිශීලක
5–8 එකවර
මධ්‍යස්ථ එකවර භාවිතය
බලය
සම්මත සොකට්ටුව
සර්වර් කාමරයක් අවශ්‍ය නැත

මිල අධික වුවද, DGX Station එක ~රු. 9.2 කෝටි සේවාදායක රාක්කයක් සහ ඊට අනුබද්ධ සිසිලන යටිතල පහසුකම් ආදේශනය කරයි. එය සම්මත බිත්ති සොකට් එකකට සම්බන්ධ වේ. මෙය සේවාදායක කාමරයේ අතිරේක වියදම සම්පූර්ණයෙන්ම ඉවත් කරයි.

ඔබේ ව්‍යාපාරය සඳහා සුදුසු AI වැඩස්ථානය තෝරා ගැනීමට උදව් අවශ්‍යද?

අපගේ ඉංජිනේරුවන්ට ඔබේ AI දෘඩාංග අවශ්‍යතා තක්සේරු කිරීමට සහ සම්පූර්ණයෙන් වින්‍යාසගත කරන ලද AI පද්ධතියක් ස්ථාපනය කිරීමට හැකියාව ඇත.

නොමිලේ දෘඩාංග තක්සේරුවක් ලබා ගන්න →

5 සේවාදායකAI සේවාදායක
AI සර්වර් රු. 46.2 ලක්ෂ - රු. 6.16 කෝටි

ඔබේ ව්‍යාපාරයට එකවරම බොහෝ සේවකයින් සේවය කිරීමට, පදනම්-පන්ති ආකෘති සම්පූර්ණ නිරවද්‍යතාවයෙන් ධාවනය කිරීමට, හෝ අයිතිවාසිකම් දත්ත මත අභිරුචෘති සුක්ෂම සීරුමාරු කිරීමට අවශ්‍ය වූ විට — ඔබ සේවාදායක පෙළට ඇතුළු වේ.

මෙය ඉහළ-පළල මතක (HBM), විශේෂිත අන්තර් සම්බන්ධක සහ රාක්-සවි කළ හැකි හෝ අසල්වැසි ස්වරූප සාධක සහිත විශේෂිත AI ත්වරක කාඩ්පත් වල වසමයි. දෘඩාංග වඩාත් මිල අධික වුවද, පරිශීලකයාට ඒකකයක පිරිවැය විශාල පරිමාණයකින් අඩු වේ.

Intel Gaudi 3

පරිමාණයෙන් හොඳම වටිනාකම

Intel Gaudi 3 ත්වරකය ආරම්භයේ සිටම AI පුහුණුව සහ අනුමාන චිප් ලෙස නිර්මාණය කර ඇත - නැවත භාවිතා කරන ලද ග්‍රැෆික් කාඩ්පතක් නොවේ. එක් එක් කාඩ්පත අනුකූල 400 Gb ඊතර්නෙට් ජාලකරණය සමඟ GB 128ක HBM2e මතකයක් ලබා දෙයි, එමඟින් වෙනම ජාල අනුකරණ අවශ්‍යතාවය ඉවත් කරයි.

ගෞඩි 3 ආකෘති සාධක දෙකකින් ලබා ගත හැකිය:

  • PCIe කාඩ්පත (HL-338): පවතින සේවාදායකයන් තුළට ඒකාබද්ධ කිරීම සඳහා සම්මත PCIe ආකෘති සාධකයකි. ඇස්තමේන්තුගත මිල: කාඩ්පතකට ~රු. 37 ලක්ෂ.
  • OAM (OCP ත්වරක මොඩියුලය): වලාකුළු දත්ත කේන්ද්‍ර සඳහා අධි-ඝනත්ව OCP ප්‍රමිතියකි. තොග 8-චිප කට්ටල මිලදී ගන්නා විට චිපයකට රු. 48.1 ලකෂ (පාදක පුවරුව සමඟ සම්පූර්ණ ~රු. 3.8 කෝටි).

කාඩ්පත් 8 කින් යුත් ගෞඩි 3 සේවාදායකයක්, සැසඳිය හැකි NVIDIA H100 පද්ධතියකට වඩා බෙහෙවින් අඩු පිරිවැයකින් 1 TB AI මතකයක් සපයයි.

💾
කාඩ්පතකට මතකය
128 GB
HBM2e — තනි කාඩ්පතක DGX Spark සමඟ ගැලපේ
8-කාඩ්පත් සම්පූර්ණය
1 TB
විශාලතම ආකෘති සඳහා එකතු කළ මතකය GB 1,024
💰
පද්ධති පිරිවැය
~රු. 6.2 කෝටි
සැසඳිය හැකි NVIDIA H100 සැකසුමකට වඩා ලාභදායී
Intel Gaudi 3 Baseboard HLB 325
Intel Gaudi 3 PCI card
Dell Intel Gaudi 3 server
Gigabyte Intel Gaudi 3 server

AMD Instinct MI325X

උපරිම ඝනත්වය

AMD Instinct MI325X කාඩ්පතකට HBM3e මතකය GB 256 ක් ඇසුරුම් කරයි — ඉන්ටෙල් ගෞඩි 3 ට වඩා දෙගුණයකි. ඉන්ටෙල් සඳහා කාඩ්පත් 8 ක් අවශ්‍ය වන අතර, සම්පූර්ණ AI මතකය 1 TB දක්වා ලබා ගැනීමට කාඩ්පත් 4 ක් පමණක් අවශ්‍ය වේ.

💾
4-කාඩ්පත් සම්පූර්ණ මතකය
1 TB
එකම ධාරිව සඳහා Intel හි කාඩ්පත් භාගයක්
පළල
6 TB/s
කාඩ්පතකට — එකවර පරිශීලකයින් සඳහා හැකියාව ලබා දෙයි
💰
පද්ධති පිරිවැය
~රු. 6.2 කෝටි
කාඩ්පතක් සමඟ ඇතුළු වීමේ පිරිවැය ~රු. 1.8 කෝටි
AMD Instinct MI325X server
Supermicro AMD Instinct MI325X server
AMD Instinct MI325X server
ASUS AMD Instinct MI325X server

MI325X එක පද්ධතියකට ගෞඩි 3 ට වඩා මිල අධිකයි, නමුත් වේගවත් හා ඝනත්වයෙන් අධිකයි. උපරිම ධාරිතාව අවශ්‍ය වැඩ භාරයන් සඳහා — වැඩි පරිශීලකයින් සඳහා තාත්වික-කාලීන අනුමාන, හෝ විශාල දත්ත කට්ටල මත අභිරුචි ආකෘති පුහුණු කිරීම — ඉහළ ආයෝජනය අඩු ප්‍රමාදය සහ සරල යටිතල පහසුකම් මගින් තමන්ව ගෙවා ගනී.

Huawei Ascend

සම්පූර්ණ-ස්ථර විකල්පය

Huawei

Huawei සම්පූර්ණ AI යටිතල පහසුකම් ස්ථරය පිටපත් කර ඇත: අභිරුචි සිලිකන් (Ascend 910B/C), අයිතිවාසිකම් සහිත අන්තර් සම්බන්ධක (HCCS), සහ සම්පූර්ණ මෘදුකාංග රාමුවක් (CANN). ප්‍රතිඵලය වන්නේ බටහිර සැපයුම් දාමවලින් ස්වාධීනව ක්‍රියා කරන සහ සමාන NVIDIA H100 කලාප වලට වඩා බෙහෙවින් අඩු පිරිවැයකින් ක්‍රියාත්මක වන ස්වයං-පූර්ණ පරිසර පද්ධතියකි.

Huawei Atlas
Huawei Ascend AI family
Huawei Atlas 300
Huawei Atlas 800i Ascend 910c

Intel Xeon 6 (Granite Rapids)

අයවැය සර්වර්

2026 දී නිහඬ විප්ලවයක් වන්නේ CPU-මත පදනම් වූ AI අනුමානයේ නැගීමයි. Intel Xeon 6 සැකසුම්කාරක AMX (Advanced Matrix Extensions) අඩංගු කරයි, එමඟින් සම්මත DDR5 RAM මත AI වැඩබරකම් ක්‍රියාත්මක කිරීමට හැකියාව ලබා දෙයි - එය GPU මතකයට වඩා බෙහෙවින් අඩු මිලකට ලබා ගත හැකිය.

විකල්පය

ද්විත්ව-සොකට් Xeon 6 සර්වරයකට GPU මතකයේ පිරිවැයෙන් කොටසක් වශයෙන් DDR5 RAM GB 1 සිට GB 4 දක්වා තබා ගත හැකිය. අනුමාන වේගයන් මන්දගාමී වේ, නමුත් කණ්ඩායම් සැකසුම් සඳහා — වේගය අදාළ නොවන නමුත් බුද්ධිමත් භාවය සහ ධාරිතාව ඉතා වැදගත් වන — මෙය පරිවර්තනාත්මක වේ.

උදාහරණය: SMB එකක් රාත්‍රියේ අයවැය පත්‍ර 100,000ක් උඩුගත කරයි. Xeon 6 සර්වරය දත්ත පරිපූර්ණව උකහා ගැනීමට +400B AI ආකෘතියක් ක්‍රියාත්මක කරයි. කාර්යයට පැය 10ක් ගත වුවද, දෘඩාංග පිරිවැය GPU සර්වරයකට වඩා බෙහෙවින් අඩුයි.

සුදුසු AI සර්වර් යටිතල පහසුකම් තෝරා ගැනීමට උදව් අවශ්‍යද?

අපගේ යටිතල පද්ධති කණ්ඩායම AI සර්වර් විසඳුම් සම්පූර්ණයෙන්ම නිර්මාණය කරයි සහ අනුස්ථාපනය කරයි — Intel Gaudi සිට NVIDIA DGX දක්වා — අභිරුචි මෘදුකාංග සමඟ ඒකාබද්ධව — ඔබේ ව්‍යාපාරය සඳහා AI හි හැකියාවන් අගුළු හරිනු පිණිස.

සර්වර් ගෘහනිර්මාණ ශිල්ප කලාපයක් ඉල්ලා සිටින්න →

6 එජ් AI
එජ් AI & ප්‍රතිසංස්කරණය පවතින යටිතල පද්ධති උසස් කිරීම

සෑම කුඩා හා මධ්‍යම ව්‍යාපාරයකටම වෙන් කරන ලද AI සර්වරයක් හෝ මිනි-පීසී එකක් අවශ්‍ය නොවේ. බොහෝ දෙනෙක් තම පවතින යටිතල පද්ධතියට බුද්ධිමත්භාවය ඇතුළත් කළ හැකිය — AI හැකියාවන් සමඟ ලැප්ටොප්, ඩෙස්ක්ටොප් සහ ජාල උපාංග අවම වියදමකින් උසස් කිරීමෙනි.

M.2 AI ත්වරක: Hailo-10

Hailo-10 යනු සම්මත M.2 2280 මොඩියුලයකි — SSD සඳහා භාවිතා කරන එකම ස්ලොට් එක — ඕනෑම පවතින PC එකකට විශේෂිත AI සැකසුම් එකතු කරයි. ඒකකයකට ~~රු. 46,200 වන අතර බලය 5–8W පමණ පමණක් පරිභෝජනය කර දෘඩාංග ප්‍රතිස්ථාපනය නොකරම ගොවිපල පුරා AI උසස් කිරීම් සක්‍රීය කරයි.

📎
හැඩතලය
M.2 2280
ඕනෑම සම්මත SSD ස්ලොට් එකකට ගැලපේ
කාර්ය සාධනය
20–50 TOPS
එජ් අනුමාන කිරීම සඳහා ප්‍රශස්ත කර ඇත
💰
වියදම
~රු. 46,200
ඒකකයකට — ගොවිපල උසස් කිරීම රු. 9.2 ලක්ෂ යටතේ

භාවිතා අවස්ථා: ප්‍රාදේශීය රැස්වීම් පිටපත් කිරීම (Whisper), තත්පර ගණන් කිරීම, හඬ නිර්දේශ කිරීම, කුඩා ආකෘති අනුමාන කිරීම (Phi-3 Mini). මෙම කාඩ්පත් විශාල LLM ධාවනය කළ නොහැක, නමුත් ඒවා විශේෂිත, අඛණ්ඩ AI කාර්යයන්හි දක්‍ෂ වේ — හඬ දත්ත දේශීයව සැකසෙන බවට සහතික කරයි සහ කිසි විටෙකත් වලාකුළු වෙත යවනු නොලැබේ.

Copilot+ පීසී (NPU ලැප්ටොප්)

Qualcomm Snapdragon X Elite, Intel Core Ultra, හෝ AMD Ryzen AI චිප සහිත ලැප්ටොප් වල සමර්පිත ස්නායුක සැකසුම් ඒකක (NPU) — විශේෂිත AI චිප අඩංගු වේ. මේවා විශාල LLM ධාවනය කළ නොහැකි නමුත්, කුඩා, අඛණ්ඩ AI කාර්යයන් හැසිරවීමට හැකියාව ඇත: සජීවී පිටපත් කිරීම, පසුබිම අස්පෝෂණය, දේශීය Recall විශේෂාංග, සහ Microsoft Phi-3 වැනි සැහැල්ලු ආකෘති ධාවනය කිරීම.

NPU ශ්‍රේණිගත කරනු ලබන්නේ TOPS (ටෙරා මෙහෙයුම් තත්පරයට) වලින් වන අතර, එය ඒවාට හසුරුවා ගත හැකි AI කාර්ය ප්‍රමාණය මනිනු ලබයි. 2026 දී ඇති වඩාත්ම බලවත් Copilot+ පරිගණකවල TOPS ~50 ක් පමණ ඇත. TOPS ඉහළ යාම යනු වේගවත් ප්‍රතිචාර සහ තරමක් විශාල AI ආකෘති හසුරුවා ගැනීමේ හැකියාවයි.

9 AI ආකෘති
විවෘත-මූල AI ආකෘති (2026–2027)

AI ආකෘතියේ තේරීම දෘඩාංග අවශ්‍යතා තීරණය කරයි — නමුත් AI ආකෘති ක්වන්ටිකරණය පිළිබඳ පරිච්ඡේදයෙන් පෙන්වා ඇති පරිදි, ක්වන්ටිකරණය මගින් ප්‍රමුඛ පෙලේ ආකෘති සම්පූර්ණ-නිරවද්‍යතා අනුස්ථාපනයට අවශ්‍ය දෘඩාංග වියදමෙන් කොටසක් වැනි දෘඩාංග මත ධාවනය කිරීමට හැකි වේ.

පහත වගුව වර්තමාන හා ඉදිරියේදී පැමිණන විවෘත මූලාශ්‍ර AI ආකෘති පිළිබඳ දළ විශ්ලේෂණයක් ලබා දෙයි.

ආකෘතියප්‍රමාණයගෘහනිර්මාණ ශිල්පයමතකය (FP16)මතකය (INT4)
Llama 4 Behemoth288B (සක්‍රීය)MoE (~2T සම්පූර්ණ)~4 TB~1 TB
Llama 4 Maverick17B (සක්‍රීය)MoE (400B සම්පූර්ණ)~800 GB~200 GB
Llama 4 Scout17B (සක්‍රීය)MoE (109B සම්පූර්ණ)~220 GB~55 GB
DeepSeek V4~70B (සක්‍රීය)MoE (671B සම්පූර්ණ)~680 GB~170 GB
DeepSeek R137B (සක්‍රීය)MoE (671B සම්පූර්ණ)~140 GB~35 GB
DeepSeek V3.2~37B (සක්‍රීය)MoE (671B සම්පූර්ණ)~140 GB~35 GB
Kimi K2.532B (සක්‍රීය)MoE (1T සම්පූර්ණ)~2 TB~500 GB
Qwen 3.5397B (සක්‍රීය)MoE (A17B)~1.5 TB~375 GB
Qwen 3-Max-Thinkingවිශාලසාන්ද්‍ර~2 TB~500 GB
Qwen 3-Coder-Next480B (A35B සක්‍රීය)MoE~960 GB~240 GB
Mistral Large 3123B (41B සක්‍රීය)MoE (675B සම්පූර්ණ)~246 GB~62 GB
Ministral 3 (3B, 8B, 14B)3B–14Bසාන්ද්‍ර~6–28 GB~2–7 GB
GLM-544B (සක්‍රීය)MoE (744B සම්පූර්ණ)~1.5 TB~370 GB
GLM-4.7 (Thinking)විශාලසාන්ද්‍ර~1.5 TB~375 GB
MiMo-V2-Flash15B (සක්‍රීය)MoE (309B සම්පූර්ණ)~30 GB~8 GB
MiniMax M2.5~10B (සක්‍රීය)MoE (~230B සම්පූර්ණ)~460 GB~115 GB
Phi-5 Reasoning14Bසාන්ද්‍ර~28 GB~7 GB
Phi-414Bසාන්ද්‍ර~28 GB~7 GB
Gemma 327Bසාන්ද්‍ර~54 GB~14 GB
Pixtral 2 Large90Bසාන්ද්‍ර~180 GB~45 GB
Stable Diffusion 4~12BDiT~24 GB~6 GB
FLUX.2 Pro15BDiT~30 GB~8 GB
Open-Sora 2.030BDiT~60 GB~15 GB
Whisper V41.5Bසාන්ද්‍ර~3 GB~1 GB
Med-Llama 470Bසාන්ද්‍ර~140 GB~35 GB
Legal-BERT 202635Bසාන්ද්‍ර~70 GB~18 GB
Finance-LLM 315Bසාන්ද්‍ර~30 GB~8 GB
CodeLlama 470Bසාන්ද්‍ර~140 GB~35 GB
Molmo 280Bසාන්ද්‍ර~160 GB~40 GB
Granite 4.032B (9B සක්‍රීය)හයිබ්‍රිඩ් Mamba-Transformer~64 GB~16 GB
Nemotron 38B, 70Bසාන්ද්‍ර~16–140 GB~4–35 GB
EXAONE 4.032Bසාන්ද්‍ර~64 GB~16 GB
Llama 5 Frontier~1.2T (සම්පූර්ණ)MoE~2.4 TB~600 GB
Llama 5 Base70B–150Bසාන්ද්‍ර~140–300 GB~35–75 GB
DeepSeek V5~600B (සම්පූර්ණ)MoE~1.2 TB~300 GB
Stable Diffusion 5TBDDiT
Falcon 3200Bසාන්ද්‍ර~400 GB~100 GB
උපායමාර්ගික උපදෙස්

පළමුව දෘඩාංග මිලදී නොගන්න. ඔබේ ව්‍යාපාර අවශ්‍යතාවලට ගැළපෙන ආකෘති පන්තිය හඳුනා ගන්න, ඉන්පසු වඩාත්ම අඩු වියදම් දෘඩාංග තට්ටුව තීරණය කිරීමට ක්වන්ටිකරණය යොදන්න.

රු. 9.2 ලක්ෂ සහ රු. 4.6 කෝටි ආයෝජනයක් අතර වෙනස බොහෝ විට ආකෘති‍රමාණ අවශ්‍යතා සහ එකවර භාවිතා කරන පරිශීලකයින් ගණන මත රඳා පවතී.

AI ආකෘති භූමිය හැඩගස්වන ප්‍රවණතා

  • සම්මතය ලෙස ස්වභාවික බහු-මාධ්‍ය. නව ආකෘති පාඨය, රූප, ශ්‍රව්‍ය සහ වීඩියෝ මත එකවර පුහුණු කරනු ලැබේ — පුහුණුවෙන් පසු එකතු කරන ලද වෙනස් හැකියාවන් ලෙස නොවේ. මෙයින් අදහස් කරන්නේ තනි ආකෘතියක් ලේඛන විශ්ලේෂණය, රූප අවබෝධය සහ හඬ අන්තර්ක්‍රියාව හසුරුවන බවයි.
  • කුඩා ආකෘති විශාල-ආකෘති හැකියාවන් සාක්ෂාත් කර ගැනීම. Phi-5 (14B) සහ MiMo-V2-Flash ගෘහනිර්මාණ ශිල්ප නවෝත්පාදනය මගින් ප්‍රමුඛ-පෙලේ තර්කනය ලැප්ටොප් එකක ධාවනය වන ආකෘතිවලට සම්පීඩනය කළ හැකි බව පෙන්වයි. "විශාලය හොඳය" යන යුගය අවසන් වෙමින් පවතී.
  • සාමාන්‍යකරණයට වඩා විශේෂාංගකරණය. සියල්ල සඳහා එක් විශාල ආකෘතියක් වෙනුවට, ප්‍රවණතාව විශේෂිත ආකෘති සමූහයක් දෙසට යොමු වේ — කේතන ආකෘතියක්, තර්කන ආකෘතියක්, දර්ශන ආකෘතියක් — ඒජන්ට් රාමුවක් මගින් සම්බන්ධීකරණය කරනු ලැබේ. මෙය ආකෘතියකට අවශ්‍ය දෘඩාංග අවශ්‍යතා අඩු කරන අතර සමස්ත ගුණාත්මකභාවය වැඩි දියුණු කරයි.
  • ඒජන්ටික් AI. Kimi K2.5 සහ Qwen 3 වැනි ආකෘති සංකීර්ණ කාර්යයන් ස්වාධීනව විඝටනය කිරීමට, බාහිර මෙවලම් භාවිතා කිරීමට සහ වෙනත් ආකෘති සමඟ සම්බන්ධීකරණය කිරීමට සැලසුම් කර ඇත. මෙම ඒජන්ට් රැළ පරාදිග්මය දිගු සැසිවාරවලදී අඛණ්ඩ තීව්‍රතාවයක් ඉල්ලා සිටී — GB10 සහ M5 Ultra වැනි ඉහළ-පළලින් යුත් දෘඩාංග වලට ප්‍රතිපක්ෂ වේ.
  • වීඩියෝ සහ 3D ජනනය පරිණත වීම. Open-Sora 2.0 සහ FLUX.2 Pro පෙන්නුම් කරන්නේ දේශීය වීඩියෝ ජනනය ප්‍රායෝගික වීමට පටන් ගෙන ඇති බවයි. 2027 වන විට, වැඩසටහන්-පන්ති දෘඩාංග මත ක්‍රියාත්මක වන තත්පර ගණන් වීඩියෝ සංස්කරණ සහායකයින් බපොරොත්තු විය හැකිය.

10 ආරක්ෂාව
උපරිම ආරක්ෂාව සඳහා ගෘහනිර්මාණ ශිල්පය

දේශීය AI දෘඩාංගයේ ප්‍රාථමික වාසිය කාර්ය සාධනය නොවේ — එය දත්ත ස්වාධීනත්වයයි. ඔබේ AI සේවාදායකය අන් අයගේ වලාකුළුවක ඇති වෙනුවට ඔබේ ගිනි බඩුව පිටුපස ධාවනය වන විට, ඔබේ සංවේදී දත්ත ඔබේ ගොඩනැගිල්ලෙන් පිටතට යන්නේ නැත.

ඇයාර්-ගැප්ඩ් API ගෘහනිර්මාණ ශිල්පය, AI සේවාදායකය අන්තර්ජාලයෙන් භෞතිකව වෙන් කරන අතර, අවසර ලත් සේවකයින්ට API අතුරුමුහුණතක් හරහා ප්‍රවේශ වීමට ඉඩ සලසයි.

Air-Gapped APIෘහනිර්මාණ ශිල්පය
👤 සේවකයා සම්මත වැඩස්ථානය
🔀 බ්‍රෝකර් සර්වරය Auth + UI + රවුටින්
🔒 AI සර්වරය Air-gapped · අන්තර්ජාලය නැත
AI ගබඩාව

මෙම ගෘහනිර්මාණ ශිල්පය ඩිජිටල් ගබඩාවක් නිර්මාණය කරයි. බ්‍රෝකර් සර්වරය අනතුරට පත් වුවද, ප්‍රහාරකයෙකුට පෙළ විමසුම් පමණක් යැවිය හැකිය — ඔවුන්ට AI සර්වරයේ ගොනු පද්ධතිය, ආකෘති බර, හොඳින්-සකස් කිරීමේ දත්ත, හෝ ගබඩා කර ඇති ලේඛන වලට ප්‍රවේශ විය නොහැකිය.

අභිරුචි AI විසඳුම් සහිත ආරක්ෂිත AI අනුස්ථාපනයක් අවශ්‍යද?

අපගේ ඉංජිනේරුවන් අභිරුචි AI ගෘහනිර්මාණ ශිල්ප සැලසුම් කර අනුස්ථාපනය කරයි, ඔබේ ව්‍යාපාරයට නවීන AI හැකියාවන් සපයන අතරම දත්ත කිසි විටෙකත් පරිශ්‍රයෙන් පිටතට නොයන බව සහතික කරයි.

ආරක්ෂිත AI ගෘහනිර්මාණ ශිල්පය සාකච්ඡා කරන්න →

11 ආර්ථිකය
ආර්ථික තීන්දුව: ස්ථානීය එදිරිව වලාකුළු

දේශීය AI දෘඩාංග වෙත සංක්‍රමණය OpEx (ක්‍රියාකාරී වියදම් — මාසික වලාකුළු API ගාස්තු) සිට CapEx (ධන වියදම් — ඔබේ ශේෂ පත්‍රයේ වත්කමක් බවට පත්වන එක් වරක දෘඩාංග ආයජනයක්) වෙත මාරුවීමකි.

ගිවිසුම් විශ්ලේෂණය කිරීම සඳහා 200B ආකෘතියක් ධාවනය කරන නීති සමාගමක් සලකා බලන්න:

☁️ වලාකුළු API
~රු. 1.11 කෝටි
වාර්ෂිකව (පරිමාණයෙන්)
දිනකට ගිවිසුම් 1,000 × නොදනී/1K ටෝකන × දින 365. භාවිතය සමඟ රේඛීයව පරිමාණනය වේ. දත්ත ජාලයෙන් පිටතට යයි.
🖥️ දේශීය දෘඩාංග (DGX Spark)
රු. 12.3 ලක්ෂ
එක් වරක ආයෝජනය
+ ~රු. 4,600/මාසය විදුලිය. අසීමිත භාවිතය. දත්ත LAN එකෙන් පිටතට නොයයි. ගණක පත්‍රයේ අයිතියකි.

දිනකට විමසුම් 1,000 ක් සමඟ, DGX Spark එක වලාකුළු API පිරිවැය සමඟ සසඳන විට මාස 2 ට අඩු කාලයකින් තමන්ව ගෙවා ගනී. ඉහළ භාවිත මට්ටම්වලදී, බ්‍රේක්-ඉවන් කාලය සති කිහිපයක් දක්වා කෙටි වේ.

ඔබ සලකා බලන විට ආර්ථික වාසිටත් වඩා හොඳ වේ:

  • බහු සේවකයින් එකම දෘඩාංග බෙදා ගැනීම (DGX Spark එක එකවර පරිශීලකයින් 2–5 දෙනෙකුට සේවය කරයි)
  • ටෝකනයකට මිල නැත — සංකීර්ණ, බහු-පියවර තර්කන කාර්යයන්ට අතිරේක වියදමක් නැත
  • අයිතිවාසිකම් දත්ත මත හොඳින්-සකස් කිරීම — බොහෝ වලාකුළු API සමඟ කළ නොහැකි, දේශීය දෘඩාංග මත නොමිලේ
  • දෘඩාංග නැවත විකිණීමේ වටිනාකම — AI දෘඩාංග ද්විතීයික වෙළඳපොලෙහි සැලකිය යුතු වටිනාකමක් රඳවා තබා ගනී