කුඩා හා මධ්‍යම ව්‍යාපාර සඳහා ප්‍රාදේශීය AI දෘඩාංග මගපෙන්වීම 2026–2027 | ⏻ ON බුද්ධිමය

එන්වීඩීඅයි ඩීජීඑක්ස් ස්පාක් — පොතක ප්‍රමාණයේ උපකරණයක් වන අතර, එය බිලියන 200 ක පරාමිති ඇති AI ආකෘති (බිලියන 400 ක් වන අවස්ථාවේදී දෙකක් සම්බන්ධ කළ විට) ධාවනය කිරීමට සමත් වේ — මෙය ඩෙස්ක්ටොප් AI අයිතියේ නව යුගය නියෝජනය කරයි.

1 පදනම
ඇයි ස්ථානීය AI? හිමිකාරිත්වය සඳහා ව්‍යාපාරික අවශ්‍යතා

2020 ගණන්වල මුල් භාගයේදී, කෘතිම බුද්ධිය ඔබ විසින් බද්දට ගත් සේවාවක් විය — පැයට, ටෝකනයට, API ඇමතුමට. 2026 වන විට, රටාව වෙනස් වී ඇත. GPT-4 පන්තියේ බුද්ධිමත්භාවය ධාවනය කිරීමට අවශ්‍ය දෘඩාංග දැන් ඔබේ මේසය මත ගැළපෙන අතර භාවිතා කළ මෝටර් රථයකට වඩා අඩු වියදමකි.

වලාකුළු පමණක් වන AI මත අඛණ්ඩ යැපීම උපායමාර්ගික ත්‍රිදුඃඛයක් ඉදිරිපත් කරයි:

වැඩිවන වියදම්. ටෝකනයකට API ගාස්තු භාවිතය සමඟ රේඛීයව පරිමාණනය වේ. දිනකට ගිවිසුම් 1,000 ක් සකසන නීති සමාගමකට වාර්ෂික API පිරිවැයෙන් ~රු. 1.11 කෝටි කට මුහුණ දිය හැකිය.
දත්ත නිරාවරණය. වලාකුළු API එකකට යවන එක් එක් විමසුම ඔබේ ජාලයෙන් පිටවන දත්ත වන අතර දත්ත ආරක්ෂාව හා පෞද්ගලිකත්ව අවදානම්වලට යටත් වේ.
ශුන්‍ය හෝ වියදම් අධික අභිරුචිකරණය. වලාකුළු ආකෘති සාමාන්‍ය වේ. ඒවා අභිරුචි දත්ත, අභ්‍යන්තර ව්‍යාපාර ක්‍රියාවලි, හෝ ව්‍යාපාර බුද්ධිය මත පහසුවෙන් හෝ පිරිවැය-කාර්යක්ෂමව සුක්ෂම කළ නොහැක.

ස්ථානීය AI දෘඩාංග මේ තුනම විසඳයි. එය විචල්‍ය API ගාස්තු ස්ථාවර ප්‍රාග්ධන වත්කමක් බවට පරිවර්තනය කරයි, දත්ත කිසි විටෙක LAN හි ඉවත් නොවන බවට සහතික කරයි, සහ ව්‍යාපාර දත්ත මත සුක්ෂම කිරීම හරහා ගැඹුරු අභිරුචිකරණය සක්‍රීය කරයි.

2 වියදම් අඩු කිරීම
ක්වෑන්ටීකරණය: ලාභයෙන් අඩු දෘඩාංග මත විශාල AI ආකෘති ධාවනය කරන්න

ක්වෑන්ටීකරණය යනු ස්ථානීය AI හි ආර්ථික විද්‍යාව මූලිකවම වෙනස් කරන සංකල්පයකි.

සරලව කිවහොත්, ක්වෑන්ටීකරණය AI ආකෘතියක මතක පරිභෝජනය හැකිලීමයි. සම්මත ආකෘතියක් සෑම පරාමිතියක්ම 16-බිට් පාවෙන ලක්ෂ්‍ය අංකයක් (FP16) ලෙස ගබඩා කරයි. ක්වෑන්ටීකරණය මෙය 8-බිට් (Int8), 4-බිට් (Int4), හෝ ඊටත් වඩා අඩු කරයි — ආකෘතිය ධාවනය කිරීමට අවශ්‍ය මතක ප්‍රමාණය නාටකීය ලෙස අඩු කරයි.

ක්වෑන්ටීකරණය ප්‍රතිදාන ගුණාත්මකභාවය තරමක් අඩු කරයි — බොහෝ විට සාරාංශ කිරීම, කෙටුම්පත් සකස් කිරීම සහ විශ්ලේෂණය වැනි ව්‍යාපාර කාර්යයන් සඳහා නොදැනෙන තරම් — දෘඩාංග වියදම් විශාල ලෙස අඩු කිරීමක් වෙනුවෙන්.

අවශ්‍ය මතකය: විවිධ නිරවද්‍යතා මට්ටම්වල 400B AI ආකෘතිය

FP16

සම්පූර්ණ නිරවද්‍යතාව

~800 GB

Int8

අඩක ප්‍රමාණය

~400 GB

Int4

සිව්වන කොටස

~200 GB

FP16 — උපරිම ගුණාත්මකභාවය, උපරිම වියදම

Int8 — ආසන්න-පරිපූර්ණ ගුණාත්මකභාවය, වියදමෙන් අඩක්

Int4 — උසස් ගුණාත්මකභාවය, වියදමෙන් සිව්වන කොටස

ව්‍යාපාරික බලපෑම

සම්පූර්ණ නිරවද්‍යතාවයෙන් යුත් 400B ආකෘතියකට ~800 GB මතකයක් අවශ්‍ය වේ — එය ~රු. 6.2 කෝටි සේවාදායක ආයෝජනයකි. එම ආකෘතියම Int4 දක්වා ක්වෑන්ටයිසේෂන් කිරීමෙන් පසු ~200 GB පමණක් අවශ්‍ය වන අතර, එය සම්බන්ධ කරන ලද DGX Spark (GB10 සුපර්චිප් මත පදනම් වූ) මිනි-පීසී දෙකක් මත ~රු. 24.6 ලක්ෂ කට ධාවනය කළ හැකිය.

විශේෂඥ මිශ්‍රණය ()

විශේෂඥයින්ගේ මිශ්‍රණය යනු තවත් AI ආකෘති ගෘහනිර්මාණ ශිල්ප ක්‍රමයක් වන අතර, එය අති විශාල මතක පිරිවැයකින් තොරව විශාල ආකෘති යෙදීමට හැකි කරයි.

සෑම ප්‍රශ්නයක් සඳහාම සියලු පරාමිති භාවිතා කිරීම වෙනුවට, MoE ආකෘතියක් එහි ධාරිතාවයෙන් කොටසක් පමණක් විරල සක්‍රිය කිරීම හරහා සක්‍රිය කරයි.

ට්‍රිලියන 2 ක පරාමිති ඇති MoE ආකෘතියක් (Llama 4 Behemoth වැනි) විමසුමකට පරාමිති 288B ක් පමණක් සක්‍රිය කරයි — මතක පිරිවැයෙන් කොටසක් වියදම් කරමින් මූලික මට්ටමේ බමත්භාවය සපයයි.

විකල්පය

MoE ආකෘති සමාන ප්‍රමාණයේ ඝන ආකෘති සමඟ සසඳන විට සරල කාර්යයන්හිදී (සාරාංශකරණය හා වර්ගීකරණය වැනි) තරමක අඩු කාර්යක්ෂමතාවකෙන්වයි. කෙසේවෙතත්, දැනුම් කාර්යයන් සහ තර්කනයන් සඳහා (සංකීර්ණ විශ්ලේෂණය, කේත ජනනය සහ පර්යේෂණය වැනි) MoE ආකෘති විශිෂ්ඨ වේ.

විරල සක්‍රිය කිරීම වේගවත් අනුමාන වේගය සහ වේගවත් ප්‍රතිචාර කාලයන්හට හේතු වේ.

3 මිනි-PC
AI මිනි-PC රු. 4.6 ලක්ෂ - රු. 30.8 ලක්ෂ

2026 දී වඩාත් බිඳහෙලන සංවර්ධනය වන්නේ මිනි-PC හැඩතලය තුළ අධි-සාමර්ථය AI පරිගණක කිරීමයි. දැන් ග්‍රන්ථයකට වඩා විශාල නොවන උපාංග වසර දෙකකට පෙර සේවාදායක කාමර අවශ්‍ය කළ AI ආකෘති ධාවනය කරයි.

NVIDIA GB10 පරිසරය (DGX Spark)

කාර්ය සාධන නායකයා

NVIDIA DGX Spark මෙම කාණ්ඩය නිර්වචනය කර ඇත. 2026 දී, ARM Grace CPU එකක් Blackwell GPU එකක් සමඟ ඒකාබද්ධ කරන GB10 සුපර්චිප් එක සම්පූර්ණ පරිසරයක් බිහි කර ඇත. ASUS, GIGABYTE, Dell, Lenovo, HP, MSI, සහ Supermicro සියල්ලම GB10-පාදක පද්ධති නිෂ්පාදනය කරයි, එක් එක් විවිධ හැඩතල, සිසිලන විසඳුම් සහ බන්ධනගත මෘදුකාංග සමඟ.

NVIDIA GB10 පරිසරය ASUS, GIGABYTE, Dell Lenovo, HP, MSI, සහ Supermicro

සිට රු. 12.3 ලක්ෂ

මතකය

128 GB

LPDDR5X ඒකාබද්ධ

ගණනය කිරීම

~1 PFLOP

FP8 AI කාර්ය සාධනය

ජාලකරණය

10 GbE + Wi-Fi 7

ක්ලස්ටරින් සඳහා ConnectX

ගබඩා කිරීම

4 TB SSD

NVMe

ක්ලස්ටරින්

ඔව් (ඒකක 2)

256 GB එකතු කළ මතකය

මෘදුකාංග

NVIDIA AI Enterprise

CUDA, cuDNN, TensorRT

ක්ලස්ටරින්: 256 GB ධාරිතාව

සමර්පිත අධි-වේග ජාල වරාය හහා GB10 ඒකක දෙකක් සම්බන්ධ කිරීමෙන්, පද්ධතිය සම්පත් 256 GB මතක අවකාශයකට එකතු කරයි. මෙය ඔබේ මේසය මතම ඉතා විශාල ආකෘති — පරාමිති 400B+ ක්වෑන්ටීකරණය කරන ලද — ධාවනය කිරීමේ හැකියාව අගුළු ඇරයි, ආසන්න වශයෙන් ~රු. 24.6 ලක්ෂ සම්පූර්ණ දෘඩාංග ආයෝජනයක් සඳහා.

AMD Ryzen AI Max (Strix Halo) මිනි-PC

අඩුම වියදම

AMD හි Ryzen AI Max+ Strix Halo ගෘහනිර්මාණ ශිල්පය බජට් AI මිනි-PC නව කාණ්ඩයක් බිහි කර ඇත. නිෂ්පාදකයින්ගේ තරංගයක් — GMKtec, Beelink, Corsair, NIMO, Bosgame, FAVM — දැන් ~රු. 6.2 ලක්ෂ යටතේ මතකය GB 128 ක් ඒකාබද්ධ කරන පද්ධති නැව්ගත කරයි.

AMD Ryzen AI Max මිනි-PC GMKtec EVO-X2 · Beelink · Corsair · NIMO AI · Bosgame M5 · FAVM FA-EX9

සිට ~රු. 4.6 ලක්ෂ

මතකය

128 GB

LPDDR5 බෙදාගත් (CPU+GPU)

ගණනය කිරීම

~0.2 PFLOP

ඒකාබද්ධ RDNA 3.5 GPU

පළල

~200 GB/s

මතක පළල

බලය

~100W

නිශ්ශබ්ද ක්‍රියාකාරිත්වය

ක්ලස්ටරින්

නැත

ස්වාධීන පමණි

Windows / Linux

ROCm / llama.cpp

Apple Mac Studio (M4 Ultra)

ධාරිතා නායකයා

Mac Studio ස්ථානීය AI භූ දර්ශනයේ අද්විතීය ස්ථානයක් ගනී. Apple හි ඒකාබද්ධ මතක ගෘහනිර්මාණ ශිල්පය (UMA) CPU සහ GPU දෙකටම ප්‍රවේශ විය හැකි මතකය GB 256 ක් දක්වා තනි, සංයුක්ත ඩෙස්ක්ටොප් ඒකකයක් ලබා දෙයි — ක්ලස්ටරින් අවශ්‍ය නොවේ.

මෙය එය විශාලතම විවෘත-මූලාශ්‍ර ආකෘති පූරණය කිරීමට සමත් එකම ජනප්‍රිය තනි උපාංගය කරයි. Int4 දක්වා ක්වෑන්ටීකරණය කරන ලද බිලියන 400 ක පරාමිති ආකෘතියක් මතකය GB 256 ක වින්‍යාසයෙන් සම්පූර්ණයෙන්ම ගැළපේ.

Apple Mac Studio (M4 Ultra) තනි-ඒකක AI ධාරිතා නායකයා

සිට රු. 12.3 ලක්ෂ

මතකය

මතකය GB 256 දක්වා

ඒකාබද්ධ මතකය (UMA)

ගණනය කිරීම

~0.5 PFLOP

Apple ස්නායු එන්ජිම + GPU

මෘදුකාංග

MLX රාමුව

Apple-ප්‍රශස්තිකරණය කළ අනුමානය

සීමාව

අනුමානය පමණි

පුහුණු කිරීම/සුක්ෂම කිරීම සඳහා සෙමින්

Apple Mac Studio (M5 Ultra)

ඉදිරි අභියෝගකරු

2026 අවසානයේ බලාපොරොත්තු වන Apple හි ඊළඟ පරම්පරාවේ M5 Ultra, M4 හි ප්‍රාථමික දුර්වලතාව විසඳනු ඇතැයි පැතිර යයි: AI ආකෘති පුහුණු කාර්ය සාධනය. TSMC හි 2nm ක්‍රියාවලිය මත ගොඩනගා ඇති එය, පළල GB/s 1.2 ඉක්මවන මතකය GB 512 ක් දක්වා වින්‍යාස ලබා දීමට බලාපොරොත්තු වේ.

Apple Mac Studio (M5 Ultra) බලාපොරොත්තු වන AI පුහුණු බලාගාරය

ඇස්. ~රු. 37 ලක්ෂ

මතකය

මතකය GB 512 දක්වා

ඊළඟ පරම්පරාවේ ඒකාබද්ධ මතකය

ගණනය කිරීම

~1.5+ PFLOP

2nm ස්නායු එන්ජිම

මෘදුකාංග

MLX 2.0+

ස්වදේශීය පුහුණු සහාය

හැකියාව

පුහුණු කිරීම සහ අනුමානය

CUDA-විකල්පය

මතක පළල: ධාරිතාව GB/s 1.2

මතකය GB 512 ක M5 Ultra යනු අක්වෑන්ටීකරණය කළ (සම්පූර්ණ නිරවද්‍යතාව) මායිම් ආකෘති ධාවනය කිරීමට සමත් පළමු පාරිභෝගික උපාංගය වනු ඇත. GB/s 1.2+ හි ඉහළ මතක පළල ඉතා දිගු සන්දර්භ කවුළු සමඟ අඛණ්ඩ අධි-ප්‍රවාහ අනුමානය අවශ්‍ය කරන ඒජන්ට් AI ක්‍රියාවලි සඳහා සහාය දක්වයි.

ටයිනි AI

පොකට් AI සුපර් කම්පියුටරය

2026 දී Kickstarter මත රු. 4.3 ලක්ෂ කට නිකුත් කරන ලද Tiiny.ai පොකට් AI පරිගණකය, 80GB LGDDR5X මතකයක් සහ 1TB SSD එකක් සහිත පොකට් සුපර් කම්පියුටරයක් වන අතර, එය ඕනෑම තැනක දේශීයව 120B AI ආකෘති ධාවනය කිරීමට සහාය වේ.

ග්‍රෑම් 300 (142×22×80mm) බරින් යුක්ත වන අතර සම්මත USB-C මගින් බල ගැන්වෙන මෙය නවෝත්පාදන ව්‍යාපාරික යෙදුම් සඳහා සහාය වේ. ටයිනි AI වාර්තා කරන්නේ GPT-OSS-120B සඳහා තත්පරයට ටෝකන 21.14 ක ප්‍රතිදාන වේගයකි.

Tenstorrent

විවෘත මූලාශ්‍ර දෘඩාංග

ප්‍රසිද්ධ චිප් ගෘහනිර්මාණ ශිල්පී Jim Keller ගේ නායකත්වයෙන් යුතුව, Tenstorrent මූලිකවම වෙනස් දර්ශනයක් නියෝජනය කරයි: RISC-V මත ගොඩනගා ඇති විවෘත-මූලාශ්‍ර දෘඩාංග, විවෘත-මූලාශ්‍ර මෘදුකාංග, සහ ඩේසි-සැකසීම හරහා මොඩියුලර් පරිමාණය.

Tensix AI හරයන් රඛීයව පරිමාණය කිරීම සඳහා නිර්මාණය කර ඇත: GPU වලට වඩා, ඔබ වැඩි කාඩ්පත් එකතු කරන විට සන්නිවේදන අධිභාරය සමඟ අපහසුතා ඇති වන, Tenstorrent චිප් කාර්යක්ෂමව ටයිල් කිරීම සඳහා ගොඩනගා ඇත.

Razer සමඟ සහයෝගීතාවයෙන්, Tenstorrent ඕනෑම ලැප්ටොප් හෝ ඩෙස්ක්ටොප් එකකට Thunderbolt හරහා සම්බන්ධ වන සංයුක්ත බාහිර AI ත්වරකයක් නිකුත් කර ඇත — දෙයක් ප්‍රතිස්ථාපනය නොකර ඇති දෘඩාංග AI වැඩස්ථානයක් බවට පරිවර්තනය කරයි.

Razer × Tenstorrent සංයුක්ත AI ත්වරකය බාහිර Thunderbolt AI ත්වරකය

මිල නොදනී

කොටුවකට මතකය

12 GB

GDDR6

චිප්

Wormhole n150

Tensix හරයන් · RISC-V

පරිමාණය

ඒකක 4 දක්වා

48 GB AI ධාරිතාව

මෘදුකාංග

සම්පූර්ණයෙන්ම විවෘත මූලාශ්‍ර

GitHub · TT-Metalium

AI NAS — ජාලයට සම්බන්ධ ගබඩාව

ගබඩාව + AI

NAS හි නිර්වචනය නිෂ්ක්‍රීය ගබඩාවෙන් සක්‍රීය බුද්ධිමත්භාවය දක්වා මාරු වී ඇත. ජාල ගබඩා උපාංගවල නව පරම්පරාව AI සැකසීම සෘජුවම ඒකාබද්ධ කරයි — සැහැල්ලු NPU-පාදක අනුමානයේ සිට සම්පූර්ණ GPU-වේගවත් LLM පිරිනැමීම දක්වා.

AI-හැකියාවෙන් යුත් NAS එකක් වෙනම AI උපාංගයක අවශ්‍යතාවය ඉවත් කරන අතර ජාල හුවමාරු ප්‍රමාදයකින් තොරව විශාල දත්ත ප්‍රමාණයක් සෘජුවම සැකසීමට ඉඩ සලසයි.

⏻

ඔබේ ව්‍යාපාරය සඳහා සුදුසු AI මිනි-PC එක තෝරා ගැනීමට උදව් අවශ්‍යද?

අපගේ ඉංජිනේරුවන්ට ඔබේ AI දෘඩාංග අවශ්‍යතා තක්සේරු කිරීමට සහ සම්පූර්ණයෙන් වින්‍යාසගත කරන ලද AI පද්ධතියක් ස්ථාපනය කිරීමට හැකියාව ඇත.

නොමිලේ දෘඩාංග තක්සේරුවක් ලබා ගන්න →

4 වැඩස්ථාන
AI වැඩස්ථාන සහ ඩෙස්ක්ටොප් PC රු. 9.2 ලක්ෂ - රු. 46.2 ලක්ෂ

වැඩස්ථාන මට්ටම වෙනස් PCIe ග්‍රැෆික් කාඩ්පත් සහ සම්මත කුළුණු ශරීර භාවිතා කරයි. මිනි-PC මට්ටමේ ස්ථාවර ඒකාබද්ධ ගෘහනිර්මාණ ශිල්පයට වඩා මෙම මට්ටම මලර් ගතිය ලබා දෙයි - තාක්ෂණය පරිණාමය වන විට ඔබට තනි අංග උසස් කිරට, තවත් GPU එකතු කිරීමට හෝ කාඩ්පත් මාරු කිරීමට හැකිය.

NVLink පාලමක් සහිත ද්විත්ව RTX A6000 වැඩස්ථානයක් ආසන්න වශයෙන් රු. 21.6 ලක්ෂ ක් වන විට 96 GB එකතු කළ VRAM පිරිවැයකින් ලබා දෙයි.

VRAM එදිරිව වේගය අවබෝධ කර ගැනීම

AI සඳහා GPU තේරීම අර්ථ දක්වන තරඟකාරී සාධක දෙකක් ඇත:

📦

VRAM ධාරිතාව

ඔබට පූරණය කළ හැකි ආකෘතියේ ප්‍රමාණය තීරණය කරයි. වැඩි VRAM යනු විශාල, වැඩි හැකියාවන් සහිත ආකෘති යන්නයි. මෙය ඔබේ බුද්ධිමත් භාවයේ උපරිමයයි.

⚡

ගණනය කිරීමේ වේගය

ආකෘතිය ප්‍රතික්‍රියා කරන වේගය තීරණය කරයි. ඉහළ ගණනය කිරීමේ ශක්තිය යනු විමසුමකට අඩු ප්‍රමාදයක් යන්නයි. මෙය ඔබේ පරිශීලක අත්දැකීමයි.

සාමාන්‍ය පාරිභෝගික කාඩ්පත් (RTX 5090 වැනි) වේගය උපරිම කරයි නමුත් සීමිත VRAM ලබා දෙයි - සාමාන්‍යයෙන් 24–32 GB. වෘත්තීය කාඩ්පත් (RTX PRO 6000 Blackwell වැනි) VRAM උපරිම කරයි - කාඩ්පතකට GB 96ක් දක්වා - නමුත් ගණනය කිරීමේ ඒකකයකට වැඩි පිරිවැයක් ගනී.

VRAM යනු බැඳී ඇති සීමාවයි. ප්‍රමාණවත් මතකයක් නොමැතිව වේගවත් කාඩ්පතකට AI ආකෘතිය පූරණය කළ නොහැක. ප්‍රමාණවත් මතකයක් සහිත මන්දගාමී කාඩ්පතක් ආකෘතිය ක්‍රියාත්මක කරයි - නමුත් දිගු ප්‍රතිචාර කාල සමඟ.

පාරිභෝගික GPU

වින්‍යාසය	සම්පූර්ණ VRAM	සම්බන්ධ කිරීම	ඇස්ත. පිරිවැය
2× RTX 3090 (පාවිච්චි කළ)	48 GB	NVLink	රු. 9.2 ලක්ෂ
2× RTX 4090	48 GB	PCIe Gen 5	රු. 12.3 ලක්ෂ
2× RTX 5090	64 GB	PCIe Gen 5	රු. 21.6 ලක්ෂ

වෘත්තීය GPU

වින්‍යාසය	සම්පූර්ණ VRAM	සම්බන්ධ කිරීම	ඇස්ත. පිරිවැය
2× RTX A6000 හොඳම වටිනාකම	96 GB	NVLink	රු. 21.6 ලක්ෂ
2× RTX 6000 Ada	96 GB	PCIe Gen 5	රු. 40 ලක්ෂ
1× RTX PRO 6000 Blackwell	96 GB	NVLink	~රු. 24.6 ලක්ෂ
4× RTX PRO 6000 Blackwell	384 GB	PCIe Gen 5	රු. 98.6 ලක්ෂ

දත්ත කේන්ද්‍ර GPU

වින්‍යාසය	සම්පූර්ණ VRAM	සම්බන්ධ කිරීම	ඇස්ත. පිරිවැය
1× L40S	48 GB	PCIe 4.0 (නිෂ්ක්‍රීය සිසිලනය)	රු. 21.6 ලක්ෂ
1× A100 PCIe	80 GB	PCIe 4.0	රු. 30.8 ලක්ෂ
1× H200 NVL	141 GB	NVLink	රු. 92.4 ලක්ෂ
4× H200 NVL	564 GB	NVLink	රු. 3.7 කෝටි
1× B200 SXM	180 GB	NVLink 5 (1.8 TB/s)	රු. 92.4 ලක්ෂ
8× B200 SXM	1,440 GB	NVLink 5 (1.8 TB/s)	රු. 7.4 කෝටි

චීන GPU

චීනයේ දේශීය GPU පරිසර පද්ධතිය වේගයෙන් පරිණත වී ඇත. චීන නිෂ්පාදක කිහිප දෙනෙක් දැන් තරඟකාරී පිරිවිතර සහ සැලකිය යුතු ලෙස අඩු මිලකට වැඩස්ථාන-පන්ති AI GPU ලබා දෙයි.

වින්‍යාසය	සම්පූර්ණ VRAM	මතක වර්ගය	ඇස්ත. පිරිවැය
1× Moore Threads MTT S4000	48 GB	GDDR6	රු. 2.5 ලක්ෂ
4× Moore Threads MTT S4000	192 GB	GDDR6	රු. 10.8 ලක්ෂ
8× Moore Threads MTT S4000	384 GB	GDDR6	රු. 20 ලක්ෂ
1× Hygon DCU Z100	32 GB	HBM2	රු. 7.7 ලක්ෂ
1× Biren BR104	32 GB	HBM2e	රු. 9.2 ලක්ෂ
8× Biren BR104	256 GB	HBM2e	රු. 73.9 ලක්ෂ
1× Huawei Ascend Atlas 300I Duo	96 GB	HBM2e	රු. 3.7 ලක්ෂ
8× Huawei Ascend Atlas 300I Duo	768 GB	HBM2e	රු. 30.8 ලක්ෂ

ඉදිරියේදී

වින්‍යාසය	සම්පූර්ණ VRAM	තත්ත්වය	ඇස්ත. පිරිවැය
RTX 5090 128 GB	128 GB	චීන වෙනස් කිරීම — සම්මත SKU එකක් නොවේ	රු. 15.4 ලක්ෂ
RTX Titan AI	64 GB	2027 දී අපේක්ෂිතයි	රු. 9.2 ලක්ෂ

MSI NVIDIA RTX PRO 6000 Blackwell Server

NVIDIA DGX Station

ව්‍යවසාය Apex

NVIDIA DGX Station යනු ජල-සිසිලනය වන, අසල්වැසි සුපර් පරිගණකයක් වන අතර එය දත්ත කේන්ද්‍ර කාර්ය සාධනය කාර්යාල පරිසරයකට ගෙන එයි. නවතම අනුවාදය GB300 Grace Blackwell Superchip භාවිතා කරයි.

NVIDIA DGX Station GB300 අනාගත-සාක්ෂි Ultra

ඇස්ත. මිල ~රු. 6.2 කෝටි

Blackwell Ultra අනුවාදය මතක ඝනත්වය සහ ගණනය කිරීමේ බලය වැඩි කරයි, එය අභිමත ආකෘති ආරම්භයේ සිට පුහුණු කිරීමට හෝ විශාල MoE (Mixture of Experts) ගෘහනිර්මාණ ශිල්ප ප්‍රාදේශීයව ක්‍රියාත්මක කිරීමට අවශ්‍ය සංවිධාන සඳහා නිර්මාණය කර ඇත.

මතකය

~1.5 TB+

HBM3e (අතිශය වේගවත්)

ගණනය කිරීම

~20+ PFLOPS

FP8 AI කාර්ය සාධනය

භාවිතා අවස්ථාව

අභිරුචි පුහුණුව

ආකෘති සංවර්ධනය

බලය

සම්මත සොකට්ටුව

සර්වර් කාමරයක් අවශ්‍ය නැත

NVIDIA DGX Station GB300 Blackwell Ultra

NVIDIA DGX Station A100 ප්‍රවේශ විය හැකි AI වැඩ යෝධයා

සිට ~රු. 3.1 කෝටි

පෙර පරම්පරාවේ ඇම්පියර් ගෘහනිර්මාණ ශිල්පය මත පදනම් වුවද, එය විශ්වසනීය අනුමාන සහ සුක්ෂම සීරුමාරු කිරීම් සඳහා කර්මාන්ත ප්‍රමිතිය ලෙස පවතී. බ්ලැක්වෙල් සඳහා අයවැයක් නොමැතිව AI අවකාශයට ඇතුළු වන කණ්ඩායම් සඳහා ඉතා සුදුසුය.

මතකය

320 GB

4x 80GB A100 GPU

ගණනය කිරීම

2 PFLO

FP16 AI කාර්ය සාධනය

බහු-පරිශීලක

5–8 එකවර

මධ්‍යස්ථ එකවර භාවිතය

බලය

සම්මත සොකට්ටුව

සර්වර් කාමරයක් අවශ්‍ය නැත

මිල අධික වුවද, DGX Station එක ~රු. 9.2 කෝටි සේවාදායක රාක්කයක් සහ ඊට අනුබද්ධ සිසිලන යටිතල පහසුකම් ආදේශනය කරයි. එය සම්මත බිත්ති සොකට් එකකට සම්බන්ධ වේ. මෙය සේවාදායක කාමරයේ අතිරේක වියදම සම්පූර්ණයෙන්ම ඉවත් කරයි.

⏻

ඔබේ ව්‍යාපාරය සඳහා සුදුසු AI වැඩස්ථානය තෝරා ගැනීමට උදව් අවශ්‍යද?

නොමිලේ දෘඩාංග තක්සේරුවක් ලබා ගන්න →

5 සේවාදායකAI සේවාදායක
AI සර්වර් රු. 46.2 ලක්ෂ - රු. 6.16 කෝටි

ඔබේ ව්‍යාපාරයට එකවරම බොහෝ සේවකයින් සේවය කිරීමට, පදනම්-පන්ති ආකෘති සම්පූර්ණ නිරවද්‍යතාවයෙන් ධාවනය කිරීමට, හෝ අයිතිවාසිකම් දත්ත මත අභිරුචෘති සුක්ෂම සීරුමාරු කිරීමට අවශ්‍ය වූ විට — ඔබ සේවාදායක පෙළට ඇතුළු වේ.

මෙය ඉහළ-පළල මතක (HBM), විශේෂිත අන්තර් සම්බන්ධක සහ රාක්-සවි කළ හැකි හෝ අසල්වැසි ස්වරූප සාධක සහිත විශේෂිත AI ත්වරක කාඩ්පත් වල වසමයි. දෘඩාංග වඩාත් මිල අධික වුවද, පරිශීලකයාට ඒකකයක පිරිවැය විශාල පරිමාණයකින් අඩු වේ.

Intel Gaudi 3

පරිමාණයෙන් හොඳම වටිනාකම

Intel Gaudi 3 ත්වරකය ආරම්භයේ සිටම AI පුහුණුව සහ අනුමාන චිප් ලෙස නිර්මාණය කර ඇත - නැවත භාවිතා කරන ලද ග්‍රැෆික් කාඩ්පතක් නොවේ. එක් එක් කාඩ්පත අනුකූල 400 Gb ඊතර්නෙට් ජාලකරණය සමඟ GB 128ක HBM2e මතකයක් ලබා දෙයි, එමඟින් වෙනම ජාල අනුකරණ අවශ්‍යතාවය ඉවත් කරයි.

ගෞඩි 3 ආකෘති සාධක දෙකකින් ලබා ගත හැකිය:

PCIe කාඩ්පත (HL-338): පවතින සේවාදායකයන් තුළට ඒකාබද්ධ කිරීම සඳහා සම්මත PCIe ආකෘති සාධකයකි. ඇස්තමේන්තුගත මිල: කාඩ්පතකට ~රු. 37 ලක්ෂ.
OAM (OCP ත්වරක මොඩියුලය): වලාකුළු දත්ත කේන්ද්‍ර සඳහා අධි-ඝනත්ව OCP ප්‍රමිතියකි. තොග 8-චිප කට්ටල මිලදී ගන්නා විට චිපයකට රු. 48.1 ලකෂ (පාදක පුවරුව සමඟ සම්පූර්ණ ~රු. 3.8 කෝටි).

කාඩ්පත් 8 කින් යුත් ගෞඩි 3 සේවාදායකයක්, සැසඳිය හැකි NVIDIA H100 පද්ධතියකට වඩා බෙහෙවින් අඩු පිරිවැයකින් 1 TB AI මතකයක් සපයයි.

💾

කාඩ්පතකට මතකය

128 GB

HBM2e — තනි කාඩ්පතක DGX Spark සමඟ ගැලපේ

⚡

8-කාඩ්පත් සම්පූර්ණය

1 TB

විශාලතම ආකෘති සඳහා එකතු කළ මතකය GB 1,024

💰

පද්ධති පිරිවැය

~රු. 6.2 කෝටි

සැසඳිය හැකි NVIDIA H100 සැකසුමකට වඩා ලාභදායී

AMD Instinct MI325X

උපරිම ඝනත්වය

AMD Instinct MI325X කාඩ්පතකට HBM3e මතකය GB 256 ක් ඇසුරුම් කරයි — ඉන්ටෙල් ගෞඩි 3 ට වඩා දෙගුණයකි. ඉන්ටෙල් සඳහා කාඩ්පත් 8 ක් අවශ්‍ය වන අතර, සම්පූර්ණ AI මතකය 1 TB දක්වා ලබා ගැනීමට කාඩ්පත් 4 ක් පමණක් අවශ්‍ය වේ.

💾

4-කාඩ්පත් සම්පූර්ණ මතකය

1 TB

එකම ධාරිව සඳහා Intel හි කාඩ්පත් භාගයක්

⚡

පළල

6 TB/s

කාඩ්පතකට — එකවර පරිශීලකයින් සඳහා හැකියාව ලබා දෙයි

💰

පද්ධති පිරිවැය

~රු. 6.2 කෝටි

කාඩ්පතක් සමඟ ඇතුළු වීමේ පිරිවැය ~රු. 1.8 කෝටි

MI325X එක පද්ධතියකට ගෞඩි 3 ට වඩා මිල අධිකයි, නමුත් වේගවත් හා ඝනත්වයෙන් අධිකයි. උපරිම ධාරිතාව අවශ්‍ය වැඩ භාරයන් සඳහා — වැඩි පරිශීලකයින් සඳහා තාත්වික-කාලීන අනුමාන, හෝ විශාල දත්ත කට්ටල මත අභිරුචි ආකෘති පුහුණු කිරීම — ඉහළ ආයෝජනය අඩු ප්‍රමාදය සහ සරල යටිතල පහසුකම් මගින් තමන්ව ගෙවා ගනී.

Huawei Ascend

සම්පූර්ණ-ස්ථර විකල්පය

Huawei සම්පූර්ණ AI යටිතල පහසුකම් ස්ථරය පිටපත් කර ඇත: අභිරුචි සිලිකන් (Ascend 910B/C), අයිතිවාසිකම් සහිත අන්තර් සම්බන්ධක (HCCS), සහ සම්පූර්ණ මෘදුකාංග රාමුවක් (CANN). ප්‍රතිඵලය වන්නේ බටහිර සැපයුම් දාමවලින් ස්වාධීනව ක්‍රියා කරන සහ සමාන NVIDIA H100 කලාප වලට වඩා බෙහෙවින් අඩු පිරිවැයකින් ක්‍රියාත්මක වන ස්වයං-පූර්ණ පරිසර පද්ධතියකි.

Intel Xeon 6 (Granite Rapids)

අයවැය සර්වර්

2026 දී නිහඬ විප්ලවයක් වන්නේ CPU-මත පදනම් වූ AI අනුමානයේ නැගීමයි. Intel Xeon 6 සැකසුම්කාරක AMX (Advanced Matrix Extensions) අඩංගු කරයි, එමඟින් සම්මත DDR5 RAM මත AI වැඩබරකම් ක්‍රියාත්මක කිරීමට හැකියාව ලබා දෙයි - එය GPU මතකයට වඩා බෙහෙවින් අඩු මිලකට ලබා ගත හැකිය.

විකල්පය

ද්විත්ව-සොකට් Xeon 6 සර්වරයකට GPU මතකයේ පිරිවැයෙන් කොටසක් වශයෙන් DDR5 RAM GB 1 සිට GB 4 දක්වා තබා ගත හැකිය. අනුමාන වේගයන් මන්දගාමී වේ, නමුත් කණ්ඩායම් සැකසුම් සඳහා — වේගය අදාළ නොවන නමුත් බුද්ධිමත් භාවය සහ ධාරිතාව ඉතා වැදගත් වන — මෙය පරිවර්තනාත්මක වේ.

උදාහරණය: SMB එකක් රාත්‍රියේ අයවැය පත්‍ර 100,000ක් උඩුගත කරයි. Xeon 6 සර්වරය දත්ත පරිපූර්ණව උකහා ගැනීමට +400B AI ආකෘතියක් ක්‍රියාත්මක කරයි. කාර්යයට පැය 10ක් ගත වුවද, දෘඩාංග පිරිවැය GPU සර්වරයකට වඩා බෙහෙවින් අඩුයි.

⏻

සුදුසු AI සර්වර් යටිතල පහසුකම් තෝරා ගැනීමට උදව් අවශ්‍යද?

අපගේ යටිතල පද්ධති කණ්ඩායම AI සර්වර් විසඳුම් සම්පූර්ණයෙන්ම නිර්මාණය කරයි සහ අනුස්ථාපනය කරයි — Intel Gaudi සිට NVIDIA DGX දක්වා — අභිරුචි මෘදුකාංග සමඟ ඒකාබද්ධව — ඔබේ ව්‍යාපාරය සඳහා AI හි හැකියාවන් අගුළු හරිනු පිණිස.

සර්වර් ගෘහනිර්මාණ ශිල්ප කලාපයක් ඉල්ලා සිටින්න →

6 එජ් AI
එජ් AI & ප්‍රතිසංස්කරණය පවතින යටිතල පද්ධති උසස් කිරීම

සෑම කුඩා හා මධ්‍යම ව්‍යාපාරයකටම වෙන් කරන ලද AI සර්වරයක් හෝ මිනි-පීසී එකක් අවශ්‍ය නොවේ. බොහෝ දෙනෙක් තම පවතින යටිතල පද්ධතියට බුද්ධිමත්භාවය ඇතුළත් කළ හැකිය — AI හැකියාවන් සමඟ ලැප්ටොප්, ඩෙස්ක්ටොප් සහ ජාල උපාංග අවම වියදමකින් උසස් කිරීමෙනි.

M.2 AI ත්වරක: Hailo-10

Hailo-10 යනු සම්මත M.2 2280 මොඩියුලයකි — SSD සඳහා භාවිතා කරන එකම ස්ලොට් එක — ඕනෑම පවතින PC එකකට විශේෂිත AI සැකසුම් එකතු කරයි. ඒකකයකට ~~රු. 46,200 වන අතර බලය 5–8W පමණ පමණක් පරිභෝජනය කර දෘඩාංග ප්‍රතිස්ථාපනය නොකරම ගොවිපල පුරා AI උසස් කිරීම් සක්‍රීය කරයි.

📎

හැඩතලය

M.2 2280

ඕනෑම සම්මත SSD ස්ලොට් එකකට ගැලපේ

⚡

කාර්ය සාධනය

20–50 TOPS

එජ් අනුමාන කිරීම සඳහා ප්‍රශස්ත කර ඇත

💰

වියදම

~රු. 46,200

ඒකකයකට — ගොවිපල උසස් කිරීම රු. 9.2 ලක්ෂ යටතේ

භාවිතා අවස්ථා: ප්‍රාදේශීය රැස්වීම් පිටපත් කිරීම (Whisper), තත්පර ගණන් කිරීම, හඬ නිර්දේශ කිරීම, කුඩා ආකෘති අනුමාන කිරීම (Phi-3 Mini). මෙම කාඩ්පත් විශාල LLM ධාවනය කළ නොහැක, නමුත් ඒවා විශේෂිත, අඛණ්ඩ AI කාර්යයන්හි දක්‍ෂ වේ — හඬ දත්ත දේශීයව සැකසෙන බවට සහතික කරයි සහ කිසි විටෙකත් වලාකුළු වෙත යවනු නොලැබේ.

Copilot+ පීසී (NPU ලැප්ටොප්)

Qualcomm Snapdragon X Elite, Intel Core Ultra, හෝ AMD Ryzen AI චිප සහිත ලැප්ටොප් වල සමර්පිත ස්නායුක සැකසුම් ඒකක (NPU) — විශේෂිත AI චිප අඩංගු වේ. මේවා විශාල LLM ධාවනය කළ නොහැකි නමුත්, කුඩා, අඛණ්ඩ AI කාර්යයන් හැසිරවීමට හැකියාව ඇත: සජීවී පිටපත් කිරීම, පසුබිම අස්පෝෂණය, දේශීය Recall විශේෂාංග, සහ Microsoft Phi-3 වැනි සැහැල්ලු ආකෘති ධාවනය කිරීම.

NPU ශ්‍රේණිගත කරනු ලබන්නේ TOPS (ටෙරා මෙහෙයුම් තත්පරයට) වලින් වන අතර, එය ඒවාට හසුරුවා ගත හැකි AI කාර්ය ප්‍රමාණය මනිනු ලබයි. 2026 දී ඇති වඩාත්ම බලවත් Copilot+ පරිගණකවල TOPS ~50 ක් පමණ ඇත. TOPS ඉහළ යාම යනු වේගවත් ප්‍රතිචාර සහ තරමක් විශාල AI ආකෘති හසුරුවා ගැනීමේ හැකියාවයි.

9 AI ආකෘති
විවෘත-මූල AI ආකෘති (2026–2027)

AI ආකෘතියේ තේරීම දෘඩාංග අවශ්‍යතා තීරණය කරයි — නමුත් AI ආකෘති ක්වන්ටිකරණය පිළිබඳ පරිච්ඡේදයෙන් පෙන්වා ඇති පරිදි, ක්වන්ටිකරණය මගින් ප්‍රමුඛ පෙලේ ආකෘති සම්පූර්ණ-නිරවද්‍යතා අනුස්ථාපනයට අවශ්‍ය දෘඩාංග වියදමෙන් කොටසක් වැනි දෘඩාංග මත ධාවනය කිරීමට හැකි වේ.

පහත වගුව වර්තමාන හා ඉදිරියේදී පැමිණන විවෘත මූලාශ්‍ර AI ආකෘති පිළිබඳ දළ විශ්ලේෂණයක් ලබා දෙයි.

ආකෘතිය	ප්‍රමාණය	ගෘහනිර්මාණ ශිල්පය	මතකය (FP16)	මතකය (INT4)
Llama 4 Behemoth	288B (සක්‍රීය)	MoE (~2T සම්පූර්ණ)	~4 TB	~1 TB
Llama 4 Maverick	17B (සක්‍රීය)	MoE (400B සම්පූර්ණ)	~800 GB	~200 GB
Llama 4 Scout	17B (සක්‍රීය)	MoE (109B සම්පූර්ණ)	~220 GB	~55 GB
DeepSeek V4	~70B (සක්‍රීය)	MoE (671B සම්පූර්ණ)	~680 GB	~170 GB
DeepSeek R1	37B (සක්‍රීය)	MoE (671B සම්පූර්ණ)	~140 GB	~35 GB
DeepSeek V3.2	~37B (සක්‍රීය)	MoE (671B සම්පූර්ණ)	~140 GB	~35 GB
Kimi K2.5	32B (සක්‍රීය)	MoE (1T සම්පූර්ණ)	~2 TB	~500 GB
Qwen 3.5	397B (සක්‍රීය)	MoE (A17B)	~1.5 TB	~375 GB
Qwen 3-Max-Thinking	විශාල	සාන්ද්‍ර	~2 TB	~500 GB
Qwen 3-Coder-Next	480B (A35B සක්‍රීය)	MoE	~960 GB	~240 GB
Mistral Large 3	123B (41B සක්‍රීය)	MoE (675B සම්පූර්ණ)	~246 GB	~62 GB
Ministral 3 (3B, 8B, 14B)	3B–14B	සාන්ද්‍ර	~6–28 GB	~2–7 GB
GLM-5	44B (සක්‍රීය)	MoE (744B සම්පූර්ණ)	~1.5 TB	~370 GB
GLM-4.7 (Thinking)	විශාල	සාන්ද්‍ර	~1.5 TB	~375 GB
MiMo-V2-Flash	15B (සක්‍රීය)	MoE (309B සම්පූර්ණ)	~30 GB	~8 GB
MiniMax M2.5	~10B (සක්‍රීය)	MoE (~230B සම්පූර්ණ)	~460 GB	~115 GB
Phi-5 Reasoning	14B	සාන්ද්‍ර	~28 GB	~7 GB
Phi-4	14B	සාන්ද්‍ර	~28 GB	~7 GB
Gemma 3	27B	සාන්ද්‍ර	~54 GB	~14 GB
Pixtral 2 Large	90B	සාන්ද්‍ර	~180 GB	~45 GB
Stable Diffusion 4	~12B	DiT	~24 GB	~6 GB
FLUX.2 Pro	15B	DiT	~30 GB	~8 GB
Open-Sora 2.0	30B	DiT	~60 GB	~15 GB
Whisper V4	1.5B	සාන්ද්‍ර	~3 GB	~1 GB
Med-Llama 4	70B	සාන්ද්‍ර	~140 GB	~35 GB
Legal-BERT 2026	35B	සාන්ද්‍ර	~70 GB	~18 GB
Finance-LLM 3	15B	සාන්ද්‍ර	~30 GB	~8 GB
CodeLlama 4	70B	සාන්ද්‍ර	~140 GB	~35 GB
Molmo 2	80B	සාන්ද්‍ර	~160 GB	~40 GB
Granite 4.0	32B (9B සක්‍රීය)	හයිබ්‍රිඩ් Mamba-Transformer	~64 GB	~16 GB
Nemotron 3	8B, 70B	සාන්ද්‍ර	~16–140 GB	~4–35 GB
EXAONE 4.0	32B	සාන්ද්‍ර	~64 GB	~16 GB
Llama 5 Frontier	~1.2T (සම්පූර්ණ)	MoE	~2.4 TB	~600 GB
Llama 5 Base	70B–150B	සාන්ද්‍ර	~140–300 GB	~35–75 GB
DeepSeek V5	~600B (සම්පූර්ණ)	MoE	~1.2 TB	~300 GB
Stable Diffusion 5	TBD	DiT	—	—
Falcon 3	200B	සාන්ද්‍ර	~400 GB	~100 GB

උපායමාර්ගික උපදෙස්

පළමුව දෘඩාංග මිලදී නොගන්න. ඔබේ ව්‍යාපාර අවශ්‍යතාවලට ගැළපෙන ආකෘති පන්තිය හඳුනා ගන්න, ඉන්පසු වඩාත්ම අඩු වියදම් දෘඩාංග තට්ටුව තීරණය කිරීමට ක්වන්ටිකරණය යොදන්න.

රු. 9.2 ලක්ෂ සහ රු. 4.6 කෝටි ආයෝජනයක් අතර වෙනස බොහෝ විට ආකෘති‍රමාණ අවශ්‍යතා සහ එකවර භාවිතා කරන පරිශීලකයින් ගණන මත රඳා පවතී.

AI ආකෘති භූමිය හැඩගස්වන ප්‍රවණතා

සම්මතය ලෙස ස්වභාවික බහු-මාධ්‍ය. නව ආකෘති පාඨය, රූප, ශ්‍රව්‍ය සහ වීඩියෝ මත එකවර පුහුණු කරනු ලැබේ — පුහුණුවෙන් පසු එකතු කරන ලද වෙනස් හැකියාවන් ලෙස නොවේ. මෙයින් අදහස් කරන්නේ තනි ආකෘතියක් ලේඛන විශ්ලේෂණය, රූප අවබෝධය සහ හඬ අන්තර්ක්‍රියාව හසුරුවන බවයි.
කුඩා ආකෘති විශාල-ආකෘති හැකියාවන් සාක්ෂාත් කර ගැනීම. Phi-5 (14B) සහ MiMo-V2-Flash ගෘහනිර්මාණ ශිල්ප නවෝත්පාදනය මගින් ප්‍රමුඛ-පෙලේ තර්කනය ලැප්ටොප් එකක ධාවනය වන ආකෘතිවලට සම්පීඩනය කළ හැකි බව පෙන්වයි. "විශාලය හොඳය" යන යුගය අවසන් වෙමින් පවතී.
සාමාන්‍යකරණයට වඩා විශේෂාංගකරණය. සියල්ල සඳහා එක් විශාල ආකෘතියක් වෙනුවට, ප්‍රවණතාව විශේෂිත ආකෘති සමූහයක් දෙසට යොමු වේ — කේතන ආකෘතියක්, තර්කන ආකෘතියක්, දර්ශන ආකෘතියක් — ඒජන්ට් රාමුවක් මගින් සම්බන්ධීකරණය කරනු ලැබේ. මෙය ආකෘතියකට අවශ්‍ය දෘඩාංග අවශ්‍යතා අඩු කරන අතර සමස්ත ගුණාත්මකභාවය වැඩි දියුණු කරයි.
ඒජන්ටික් AI. Kimi K2.5 සහ Qwen 3 වැනි ආකෘති සංකීර්ණ කාර්යයන් ස්වාධීනව විඝටනය කිරීමට, බාහිර මෙවලම් භාවිතා කිරීමට සහ වෙනත් ආකෘති සමඟ සම්බන්ධීකරණය කිරීමට සැලසුම් කර ඇත. මෙම ඒජන්ට් රැළ පරාදිග්මය දිගු සැසිවාරවලදී අඛණ්ඩ තීව්‍රතාවයක් ඉල්ලා සිටී — GB10 සහ M5 Ultra වැනි ඉහළ-පළලින් යුත් දෘඩාංග වලට ප්‍රතිපක්ෂ වේ.
වීඩියෝ සහ 3D ජනනය පරිණත වීම. Open-Sora 2.0 සහ FLUX.2 Pro පෙන්නුම් කරන්නේ දේශීය වීඩියෝ ජනනය ප්‍රායෝගික වීමට පටන් ගෙන ඇති බවයි. 2027 වන විට, වැඩසටහන්-පන්ති දෘඩාංග මත ක්‍රියාත්මක වන තත්පර ගණන් වීඩියෝ සංස්කරණ සහායකයින් බපොරොත්තු විය හැකිය.

10 ආරක්ෂාව
උපරිම ආරක්ෂාව සඳහා ගෘහනිර්මාණ ශිල්පය

දේශීය AI දෘඩාංගයේ ප්‍රාථමික වාසිය කාර්ය සාධනය නොවේ — එය දත්ත ස්වාධීනත්වයයි. ඔබේ AI සේවාදායකය අන් අයගේ වලාකුළුවක ඇති වෙනුවට ඔබේ ගිනි බඩුව පිටුපස ධාවනය වන විට, ඔබේ සංවේදී දත්ත ඔබේ ගොඩනැගිල්ලෙන් පිටතට යන්නේ නැත.

ඇයාර්-ගැප්ඩ් API ගෘහනිර්මාණ ශිල්පය, AI සේවාදායකය අන්තර්ජාලයෙන් භෞතිකව වෙන් කරන අතර, අවසර ලත් සේවකයින්ට API අතුරුමුහුණතක් හරහා ප්‍රවේශ වීමට ඉඩ සලසයි.

Air-Gapped APIෘහනිර්මාණ ශිල්පය

👤 සේවකයා සම්මත වැඩස්ථානය

→

🔀 බ්‍රෝකර් සර්වරය Auth + UI + රවුටින්

⟶

🔒 AI සර්වරය Air-gapped · අන්තර්ජාලය නැත

AI ගබඩාව

මෙම ගෘහනිර්මාණ ශිල්පය ඩිජිටල් ගබඩාවක් නිර්මාණය කරයි. බ්‍රෝකර් සර්වරය අනතුරට පත් වුවද, ප්‍රහාරකයෙකුට පෙළ විමසුම් පමණක් යැවිය හැකිය — ඔවුන්ට AI සර්වරයේ ගොනු පද්ධතිය, ආකෘති බර, හොඳින්-සකස් කිරීමේ දත්ත, හෝ ගබඩා කර ඇති ලේඛන වලට ප්‍රවේශ විය නොහැකිය.

⏻

අභිරුචි AI විසඳුම් සහිත ආරක්ෂිත AI අනුස්ථාපනයක් අවශ්‍යද?

අපගේ ඉංජිනේරුවන් අභිරුචි AI ගෘහනිර්මාණ ශිල්ප සැලසුම් කර අනුස්ථාපනය කරයි, ඔබේ ව්‍යාපාරයට නවීන AI හැකියාවන් සපයන අතරම දත්ත කිසි විටෙකත් පරිශ්‍රයෙන් පිටතට නොයන බව සහතික කරයි.

ආරක්ෂිත AI ගෘහනිර්මාණ ශිල්පය සාකච්ඡා කරන්න →

11 ආර්ථිකය
ආර්ථික තීන්දුව: ස්ථානීය එදිරිව වලාකුළු

දේශීය AI දෘඩාංග වෙත සංක්‍රමණය OpEx (ක්‍රියාකාරී වියදම් — මාසික වලාකුළු API ගාස්තු) සිට CapEx (ධන වියදම් — ඔබේ ශේෂ පත්‍රයේ වත්කමක් බවට පත්වන එක් වරක දෘඩාංග ආයජනයක්) වෙත මාරුවීමකි.

ගිවිසුම් විශ්ලේෂණය කිරීම සඳහා 200B ආකෘතියක් ධාවනය කරන නීති සමාගමක් සලකා බලන්න:

☁️ වලාකුළු API

~රු. 1.11 කෝටි

වාර්ෂිකව (පරිමාණයෙන්)

දිනකට ගිවිසුම් 1,000 × නොදනී/1K ටෝකන × දින 365. භාවිතය සමඟ රේඛීයව පරිමාණනය වේ. දත්ත ජාලයෙන් පිටතට යයි.

🖥️ දේශීය දෘඩාංග (DGX Spark)

රු. 12.3 ලක්ෂ

එක් වරක ආයෝජනය

+ ~රු. 4,600/මාසය විදුලිය. අසීමිත භාවිතය. දත්ත LAN එකෙන් පිටතට නොයයි. ගණක පත්‍රයේ අයිතියකි.

දිනකට විමසුම් 1,000 ක් සමඟ, DGX Spark එක වලාකුළු API පිරිවැය සමඟ සසඳන විට මාස 2 ට අඩු කාලයකින් තමන්ව ගෙවා ගනී. ඉහළ භාවිත මට්ටම්වලදී, බ්‍රේක්-ඉවන් කාලය සති කිහිපයක් දක්වා කෙටි වේ.

ඔබ සලකා බලන විට ආර්ථික වාසිටත් වඩා හොඳ වේ:

බහු සේවකයින් එකම දෘඩාංග බෙදා ගැනීම (DGX Spark එක එකවර පරිශීලකයින් 2–5 දෙනෙකුට සේවය කරයි)
ටෝකනයකට මිල නැත — සංකීර්ණ, බහු-පියවර තර්කන කාර්යයන්ට අතිරේක වියදමක් නැත
අයිතිවාසිකම් දත්ත මත හොඳින්-සකස් කිරීම — බොහෝ වලාකුළු API සමඟ කළ නොහැකි, දේශීය දෘඩාංග මත නොමිලේ
දෘඩාංග නැවත විකිණීමේ වටිනාකම — AI දෘඩාංග ද්විතීයික වෙළඳපොලෙහි සැලකිය යුතු වටිනාකමක් රඳවා තබා ගනී

කුඩා හා මධ්‍යම ව්‍යාපාර සඳහා ස්ථානීය AI දෘඩාංග පිළිබඳ සම්පූර්ණ මාර්ගෝපදේශය

1 පදනම
ඇයි ස්ථානීය AI? හිමිකාරිත්වය සඳහා ව්‍යාපාරික අවශ්‍යතා

2 වියදම් අඩු කිරීම
ක්වෑන්ටීකරණය: ලාභයෙන් අඩු දෘඩාංග මත විශාල AI ආකෘති ධාවනය කරන්න

විශේෂඥ මිශ්‍රණය ()

3 මිනි-PC
AI මිනි-PC රු. 4.6 ලක්ෂ - රු. 30.8 ලක්ෂ

NVIDIA GB10 පරිසරය (DGX Spark)

AMD Ryzen AI Max (Strix Halo) මිනි-PC

Apple Mac Studio (M4 Ultra)

Apple Mac Studio (M5 Ultra)

ටයිනි AI

Tenstorrent

AI NAS — ජාලයට සම්බන්ධ ගබඩාව

ඔබේ ව්‍යාපාරය සඳහා සුදුසු AI මිනි-PC එක තෝරා ගැනීමට උදව් අවශ්‍යද?

4 වැඩස්ථාන
AI වැඩස්ථාන සහ ඩෙස්ක්ටොප් PC රු. 9.2 ලක්ෂ - රු. 46.2 ලක්ෂ

VRAM එදිරිව වේගය අවබෝධ කර ගැනීම

පාරිභෝගික GPU

වෘත්තීය GPU

දත්ත කේන්ද්‍ර GPU

චීන GPU

ඉදිරියේදී

NVIDIA DGX Station

ඔබේ ව්‍යාපාරය සඳහා සුදුසු AI වැඩස්ථානය තෝරා ගැනීමට උදව් අවශ්‍යද?

5 සේවාදායකAI සේවාදායක
AI සර්වර් රු. 46.2 ලක්ෂ - රු. 6.16 කෝටි

Intel Gaudi 3

AMD Instinct MI325X

Huawei Ascend

Intel Xeon 6 (Granite Rapids)

සුදුසු AI සර්වර් යටිතල පහසුකම් තෝරා ගැනීමට උදව් අවශ්‍යද?

6 එජ් AI
එජ් AI & ප්‍රතිසංස්කරණය පවතින යටිතල පද්ධති උසස් කිරීම

M.2 AI ත්වරක: Hailo-10

Copilot+ පීසී (NPU ලැප්ටොප්)

9 AI ආකෘති
විවෘත-මූල AI ආකෘති (2026–2027)

AI ආකෘති භූමිය හැඩගස්වන ප්‍රවණතා

10 ආරක්ෂාව
උපරිම ආරක්ෂාව සඳහා ගෘහනිර්මාණ ශිල්පය

අභිරුචි AI විසඳුම් සහිත ආරක්ෂිත AI අනුස්ථාපනයක් අවශ්‍යද?

11 ආර්ථිකය
ආර්ථික තීන්දුව: ස්ථානීය එදිරිව වලාකුළු

ඔබේ ව්‍යාපාරය සඳහා බුද්ධිමත්භාවය සක්‍රිය කරන්න

කුඩා හා මධ්‍යම ව්‍යාපාර සඳහා ස්ථානීය AI දෘඩාංග පිළිබඳ සම්පූර්ණ මාර්ගෝපදේශය

1 පදනමඇයි ස්ථානීය AI? හිමිකාරිත්වය සඳහා ව්‍යාපාරික අවශ්‍යතා

2 වියදම් අඩු කිරීමක්වෑන්ටීකරණය: ලාභයෙන් අඩු දෘඩාංග මත විශාල AI ආකෘති ධාවනය කරන්න

විශේෂඥ මිශ්‍රණය ()

3 මිනි-PCAI මිනි-PC රු. 4.6 ලක්ෂ - රු. 30.8 ලක්ෂ

NVIDIA GB10 පරිසරය (DGX Spark)

AMD Ryzen AI Max (Strix Halo) මිනි-PC

Apple Mac Studio (M4 Ultra)

Apple Mac Studio (M5 Ultra)

ටයිනි AI

Tenstorrent

AI NAS — ජාලයට සම්බන්ධ ගබඩාව

ඔබේ ව්‍යාපාරය සඳහා සුදුසු AI මිනි-PC එක තෝරා ගැනීමට උදව් අවශ්‍යද?

4 වැඩස්ථානAI වැඩස්ථාන සහ ඩෙස්ක්ටොප් PC රු. 9.2 ලක්ෂ - රු. 46.2 ලක්ෂ

VRAM එදිරිව වේගය අවබෝධ කර ගැනීම

පාරිභෝගික GPU

වෘත්තීය GPU

දත්ත කේන්ද්‍ර GPU

චීන GPU

ඉදිරියේදී

NVIDIA DGX Station

ඔබේ ව්‍යාපාරය සඳහා සුදුසු AI වැඩස්ථානය තෝරා ගැනීමට උදව් අවශ්‍යද?

5 සේවාදායකAI සේවාදායකAI සර්වර් රු. 46.2 ලක්ෂ - රු. 6.16 කෝටි

Intel Gaudi 3

AMD Instinct MI325X

Huawei Ascend

Intel Xeon 6 (Granite Rapids)

සුදුසු AI සර්වර් යටිතල පහසුකම් තෝරා ගැනීමට උදව් අවශ්‍යද?

6 එජ් AIඑජ් AI & ප්‍රතිසංස්කරණය පවතින යටිතල පද්ධති උසස් කිරීම

M.2 AI ත්වරක: Hailo-10

Copilot+ පීසී (NPU ලැප්ටොප්)

9 AI ආකෘතිවිවෘත-මූල AI ආකෘති (2026–2027)

AI ආකෘති භූමිය හැඩගස්වන ප්‍රවණතා

10 ආරක්ෂාවඋපරිම ආරක්ෂාව සඳහා ගෘහනිර්මාණ ශිල්පය

අභිරුචි AI විසඳුම් සහිත ආරක්ෂිත AI අනුස්ථාපනයක් අවශ්‍යද?

11 ආර්ථිකයආර්ථික තීන්දුව: ස්ථානීය එදිරිව වලාකුළු

ඔබේ ව්‍යාපාරය සඳහා බුද්ධිමත්භාවය සක්‍රිය කරන්න

1 පදනම
ඇයි ස්ථානීය AI? හිමිකාරිත්වය සඳහා ව්‍යාපාරික අවශ්‍යතා

2 වියදම් අඩු කිරීම
ක්වෑන්ටීකරණය: ලාභයෙන් අඩු දෘඩාංග මත විශාල AI ආකෘති ධාවනය කරන්න

3 මිනි-PC
AI මිනි-PC රු. 4.6 ලක්ෂ - රු. 30.8 ලක්ෂ

4 වැඩස්ථාන
AI වැඩස්ථාන සහ ඩෙස්ක්ටොප් PC රු. 9.2 ලක්ෂ - රු. 46.2 ලක්ෂ

5 සේවාදායකAI සේවාදායක
AI සර්වර් රු. 46.2 ලක්ෂ - රු. 6.16 කෝටි

6 එජ් AI
එජ් AI & ප්‍රතිසංස්කරණය පවතින යටිතල පද්ධති උසස් කිරීම

9 AI ආකෘති
විවෘත-මූල AI ආකෘති (2026–2027)

10 ආරක්ෂාව
උපරිම ආරක්ෂාව සඳහා ගෘහනිර්මාණ ශිල්පය

11 ආර්ථිකය
ආර්ථික තීන්දුව: ස්ථානීය එදිරිව වලාකුළු