1 පදනම
ඇයි ස්ථානීය AI? හිමිකාරිත්වය සඳහා ව්යාපාරික අවශ්යතා
2020 ගණන්වල මුල් භාගයේදී, කෘතිම බුද්ධිය ඔබ විසින් බද්දට ගත් සේවාවක් විය — පැයට, ටෝකනයට, API ඇමතුමට. 2026 වන විට, රටාව වෙනස් වී ඇත. GPT-4 පන්තියේ
බුද්ධිමත්භාවය ධාවනය කිරීමට අවශ්ය දෘඩාංග දැන් ඔබේ මේසය මත ගැළපෙන අතර භාවිතා කළ මෝටර් රථයකට වඩා අඩු වියදමකි.
වලාකුළු පමණක් වන AI මත අඛණ්ඩ යැපීම උපායමාර්ගික ත්රිදුඃඛයක් ඉදිරිපත් කරයි:
- වැඩිවන වියදම්. ටෝකනයකට API ගාස්තු භාවිතය සමඟ රේඛීයව පරිමාණනය වේ. දිනකට ගිවිසුම් 1,000 ක් සකසන නීති සමාගමකට වාර්ෂික API පිරිවැයෙන් ~රු. 1.11 කෝටි කට මුහුණ දිය හැකිය.
- දත්ත නිරාවරණය. වලාකුළු API එකකට යවන එක් එක් විමසුම ඔබේ ජාලයෙන් පිටවන දත්ත වන අතර දත්ත ආරක්ෂාව හා පෞද්ගලිකත්ව අවදානම්වලට යටත් වේ.
- ශුන්ය හෝ වියදම් අධික අභිරුචිකරණය. වලාකුළු ආකෘති සාමාන්ය වේ. ඒවා අභිරුචි දත්ත, අභ්යන්තර ව්යාපාර ක්රියාවලි, හෝ ව්යාපාර බුද්ධිය මත පහසුවෙන් හෝ පිරිවැය-කාර්යක්ෂමව සුක්ෂම කළ නොහැක.
ස්ථානීය AI දෘඩාංග මේ තුනම විසඳයි. එය විචල්ය API ගාස්තු ස්ථාවර ප්රාග්ධන වත්කමක් බවට පරිවර්තනය කරයි, දත්ත කිසි විටෙක LAN හි ඉවත් නොවන බවට සහතික කරයි, සහ ව්යාපාර දත්ත මත සුක්ෂම කිරීම හරහා ගැඹුරු අභිරුචිකරණය සක්රීය කරයි.
2 වියදම් අඩු කිරීම
ක්වෑන්ටීකරණය: ලාභයෙන් අඩු දෘඩාංග මත විශාල AI ආකෘති ධාවනය කරන්න
ක්වෑන්ටීකරණය යනු ස්ථානීය AI හි ආර්ථික විද්යාව මූලිකවම වෙනස් කරන සංකල්පයකි.
සරලව කිවහොත්, ක්වෑන්ටීකරණය AI ආකෘතියක මතක පරිභෝජනය හැකිලීමයි. සම්මත ආකෘතියක් සෑම පරාමිතියක්ම 16-බිට් පාවෙන ලක්ෂ්ය අංකයක් (FP16) ලෙස ගබඩා කරයි. ක්වෑන්ටීකරණය මෙය 8-බිට් (Int8), 4-බිට් (Int4), හෝ ඊටත් වඩා අඩු කරයි — ආකෘතිය ධාවනය කිරීමට අවශ්ය මතක ප්රමාණය නාටකීය ලෙස අඩු කරයි.
ක්වෑන්ටීකරණය ප්රතිදාන ගුණාත්මකභාවය තරමක් අඩු කරයි — බොහෝ විට සාරාංශ කිරීම, කෙටුම්පත් සකස් කිරීම සහ විශ්ලේෂණය වැනි ව්යාපාර කාර්යයන් සඳහා නොදැනෙන තරම් — දෘඩාංග වියදම් විශාල ලෙස අඩු කිරීමක් වෙනුවෙන්.
සම්පූර්ණ නිරවද්යතාවයෙන් යුත් 400B ආකෘතියකට ~800 GB මතකයක් අවශ්ය වේ — එය ~රු. 6.2 කෝටි සේවාදායක ආයෝජනයකි. එම ආකෘතියම Int4 දක්වා ක්වෑන්ටයිසේෂන් කිරීමෙන් පසු ~200 GB පමණක් අවශ්ය වන අතර, එය සම්බන්ධ කරන ලද DGX Spark (GB10 සුපර්චිප් මත පදනම් වූ) මිනි-පීසී දෙකක් මත ~රු. 24.6 ලක්ෂ කට ධාවනය කළ හැකිය.
විශේෂඥ මිශ්රණය ()
විශේෂඥයින්ගේ මිශ්රණය යනු තවත් AI ආකෘති ගෘහනිර්මාණ ශිල්ප ක්රමයක් වන අතර, එය අති විශාල මතක පිරිවැයකින් තොරව විශාල ආකෘති යෙදීමට හැකි කරයි.
සෑම ප්රශ්නයක් සඳහාම සියලු පරාමිති භාවිතා කිරීම වෙනුවට, MoE ආකෘතියක් එහි ධාරිතාවයෙන් කොටසක් පමණක් විරල සක්රිය කිරීම හරහා සක්රිය කරයි.
ට්රිලියන 2 ක පරාමිති ඇති MoE ආකෘතියක් (Llama 4 Behemoth වැනි) විමසුමකට පරාමිති 288B ක් පමණක් සක්රිය කරයි — මතක පිරිවැයෙන් කොටසක් වියදම් කරමින් මූලික මට්ටමේ බමත්භාවය සපයයි.
MoE ආකෘති සමාන ප්රමාණයේ ඝන ආකෘති සමඟ සසඳන විට සරල කාර්යයන්හිදී (සාරාංශකරණය හා වර්ගීකරණය වැනි) තරමක අඩු කාර්යක්ෂමතාවකෙන්වයි. කෙසේවෙතත්, දැනුම් කාර්යයන් සහ තර්කනයන් සඳහා (සංකීර්ණ විශ්ලේෂණය, කේත ජනනය සහ පර්යේෂණය වැනි) MoE ආකෘති විශිෂ්ඨ වේ.
විරල සක්රිය කිරීම වේගවත් අනුමාන වේගය සහ වේගවත් ප්රතිචාර කාලයන්හට හේතු වේ.
3 මිනි-PC
AI මිනි-PC රු. 4.6 ලක්ෂ - රු. 30.8 ලක්ෂ
2026 දී වඩාත් බිඳහෙලන සංවර්ධනය වන්නේ මිනි-PC හැඩතලය තුළ අධි-සාමර්ථය AI පරිගණක කිරීමයි. දැන් ග්රන්ථයකට වඩා විශාල නොවන උපාංග වසර දෙකකට පෙර සේවාදායක කාමර අවශ්ය කළ AI ආකෘති ධාවනය කරයි.
NVIDIA GB10 පරිසරය (DGX Spark)
කාර්ය සාධන නායකයා
NVIDIA DGX Spark මෙම කාණ්ඩය නිර්වචනය කර ඇත. 2026 දී, ARM Grace CPU එකක් Blackwell GPU එකක් සමඟ ඒකාබද්ධ කරන GB10 සුපර්චිප් එක සම්පූර්ණ පරිසරයක් බිහි කර ඇත. ASUS, GIGABYTE, Dell, Lenovo, HP, MSI, සහ Supermicro සියල්ලම GB10-පාදක පද්ධති නිෂ්පාදනය කරයි, එක් එක් විවිධ හැඩතල, සිසිලන විසඳුම් සහ බන්ධනගත මෘදුකාංග සමඟ.
සමර්පිත අධි-වේග ජාල වරාය හහා GB10 ඒකක දෙකක් සම්බන්ධ කිරීමෙන්, පද්ධතිය සම්පත් 256 GB මතක අවකාශයකට එකතු කරයි. මෙය ඔබේ මේසය මතම ඉතා විශාල ආකෘති — පරාමිති 400B+ ක්වෑන්ටීකරණය කරන ලද — ධාවනය කිරීමේ හැකියාව අගුළු ඇරයි, ආසන්න වශයෙන් ~රු. 24.6 ලක්ෂ සම්පූර්ණ දෘඩාංග ආයෝජනයක් සඳහා.
AMD Ryzen AI Max (Strix Halo) මිනි-PC
අඩුම වියදම
AMD හි Ryzen AI Max+ Strix Halo
ගෘහනිර්මාණ ශිල්පය බජට් AI මිනි-PC නව කාණ්ඩයක් බිහි කර ඇත. නිෂ්පාදකයින්ගේ තරංගයක් — GMKtec, Beelink, Corsair, NIMO, Bosgame, FAVM — දැන් ~රු. 6.2 ලක්ෂ යටතේ මතකය GB 128 ක් ඒකාබද්ධ කරන පද්ධති නැව්ගත කරයි.
Apple Mac Studio (M4 Ultra)
ධාරිතා නායකයා
Mac Studio ස්ථානීය AI භූ දර්ශනයේ අද්විතීය ස්ථානයක් ගනී. Apple හි ඒකාබද්ධ මතක ගෘහනිර්මාණ ශිල්පය (UMA) CPU සහ GPU දෙකටම ප්රවේශ විය හැකි මතකය GB 256 ක් දක්වා තනි, සංයුක්ත ඩෙස්ක්ටොප් ඒකකයක් ලබා දෙයි — ක්ලස්ටරින් අවශ්ය නොවේ.
මෙය එය විශාලතම විවෘත-මූලාශ්ර ආකෘති පූරණය කිරීමට සමත් එකම ජනප්රිය
තනි උපාංගය කරයි. Int4 දක්වා ක්වෑන්ටීකරණය කරන ලද බිලියන 400 ක පරාමිති ආකෘතියක් මතකය GB 256 ක වින්යාසයෙන් සම්පූර්ණයෙන්ම ගැළපේ.
Apple Mac Studio (M5 Ultra)
ඉදිරි අභියෝගකරු
2026 අවසානයේ බලාපොරොත්තු වන Apple හි ඊළඟ පරම්පරාවේ M5 Ultra, M4 හි ප්රාථමික දුර්වලතාව විසඳනු ඇතැයි පැතිර යයි: AI ආකෘති පුහුණු කාර්ය සාධනය. TSMC හි 2nm ක්රියාවලිය මත ගොඩනගා ඇති එය, පළල GB/s 1.2 ඉක්මවන මතකය GB 512 ක් දක්වා වින්යාස ලබා දීමට බලාපොරොත්තු වේ.
මතකය GB 512 ක M5 Ultra යනු අක්වෑන්ටීකරණය කළ (සම්පූර්ණ නිරවද්යතාව) මායිම් ආකෘති ධාවනය කිරීමට සමත් පළමු පාරිභෝගික උපාංගය වනු ඇත. GB/s 1.2+ හි ඉහළ මතක පළල ඉතා දිගු සන්දර්භ කවුළු සමඟ අඛණ්ඩ අධි-ප්රවාහ අනුමානය අවශ්ය කරන ඒජන්ට් AI ක්රියාවලි සඳහා සහාය දක්වයි.
ටයිනි AI
පොකට් AI සුපර් කම්පියුටරය
2026 දී Kickstarter මත රු. 4.3 ලක්ෂ කට නිකුත් කරන ලද Tiiny.ai පොකට් AI පරිගණකය, 80GB LGDDR5X මතකයක් සහ 1TB SSD එකක් සහිත පොකට් සුපර් කම්පියුටරයක් වන අතර, එය ඕනෑම තැනක දේශීයව 120B AI ආකෘති ධාවනය කිරීමට සහාය වේ.
ග්රෑම් 300 (142×22×80mm) බරින් යුක්ත වන අතර සම්මත USB-C මගින් බල ගැන්වෙන මෙය නවෝත්පාදන ව්යාපාරික යෙදුම් සඳහා සහාය වේ. ටයිනි AI වාර්තා කරන්නේ GPT-OSS-120B සඳහා තත්පරයට ටෝකන 21.14 ක ප්රතිදාන වේගයකි.
Tenstorrent
විවෘත මූලාශ්ර දෘඩාංග
ප්රසිද්ධ චිප් ගෘහනිර්මාණ ශිල්පී Jim Keller ගේ නායකත්වයෙන් යුතුව, Tenstorrent මූලිකවම වෙනස් දර්ශනයක් නියෝජනය කරයි: RISC-V මත ගොඩනගා ඇති විවෘත-මූලාශ්ර දෘඩාංග, විවෘත-මූලාශ්ර මෘදුකාංග, සහ ඩේසි-සැකසීම හරහා මොඩියුලර් පරිමාණය.
Tensix
AI හරයන් රඛීයව පරිමාණය කිරීම සඳහා නිර්මාණය කර ඇත: GPU වලට වඩා, ඔබ වැඩි කාඩ්පත් එකතු කරන විට සන්නිවේදන අධිභාරය සමඟ අපහසුතා ඇති වන, Tenstorrent චිප් කාර්යක්ෂමව ටයිල් කිරීම සඳහා ගොඩනගා ඇත.
Razer සමඟ සහයෝගීතාවයෙන්, Tenstorrent ඕනෑම ලැප්ටොප් හෝ ඩෙස්ක්ටොප් එකකට Thunderbolt හරහා සම්බන්ධ වන සංයුක්ත බාහිර AI ත්වරකයක් නිකුත් කර ඇත — දෙයක් ප්රතිස්ථාපනය නොකර ඇති දෘඩාංග AI වැඩස්ථානයක් බවට පරිවර්තනය කරයි.
AI NAS — ජාලයට සම්බන්ධ ගබඩාව
ගබඩාව + AI
NAS හි නිර්වචනය නිෂ්ක්රීය ගබඩාවෙන් සක්රීය බුද්ධිමත්භාවය දක්වා මාරු වී ඇත. ජාල ගබඩා උපාංගවල නව පරම්පරාව AI සැකසීම සෘජුවම ඒකාබද්ධ කරයි — සැහැල්ලු NPU-පාදක අනුමානයේ සිට සම්පූර්ණ GPU-වේගවත් LLM පිරිනැමීම දක්වා.
AI-හැකියාවෙන් යුත් NAS එකක් වෙනම AI උපාංගයක අවශ්යතාවය ඉවත් කරන අතර ජාල හුවමාරු ප්රමාදයකින් තොරව විශාල දත්ත ප්රමාණයක් සෘජුවම සැකසීමට ඉඩ සලසයි.
ඔබේ ව්යාපාරය සඳහා සුදුසු AI මිනි-PC එක තෝරා ගැනීමට උදව් අවශ්යද?
අපගේ ඉංජිනේරුවන්ට ඔබේ AI දෘඩාංග අවශ්යතා තක්සේරු කිරීමට සහ සම්පූර්ණයෙන් වින්යාසගත කරන ලද AI පද්ධතියක් ස්ථාපනය කිරීමට හැකියාව ඇත.
නොමිලේ දෘඩාංග තක්සේරුවක් ලබා ගන්න →4 වැඩස්ථාන
AI වැඩස්ථාන සහ ඩෙස්ක්ටොප් PC රු. 9.2 ලක්ෂ - රු. 46.2 ලක්ෂ
වැඩස්ථාන මට්ටම වෙනස් PCIe ග්රැෆික් කාඩ්පත් සහ සම්මත කුළුණු ශරීර භාවිතා කරයි. මිනි-PC මට්ටමේ ස්ථාවර ඒකාබද්ධ ගෘහනිර්මාණ ශිල්පයට වඩා මෙම මට්ටම මලර් ගතිය ලබා දෙයි - තාක්ෂණය පරිණාමය වන විට ඔබට තනි අංග උසස් කිරට, තවත් GPU එකතු කිරීමට හෝ කාඩ්පත් මාරු කිරීමට හැකිය.
VRAM එදිරිව වේගය අවබෝධ කර ගැනීම
AI සඳහා GPU තේරීම අර්ථ දක්වන තරඟකාරී සාධක දෙකක් ඇත:
සාමාන්ය පාරිභෝගික කාඩ්පත් (RTX 5090 වැනි) වේගය උපරිම කරයි නමුත් සීමිත VRAM ලබා දෙයි - සාමාන්යයෙන් 24–32 GB. වෘත්තීය කාඩ්පත් (RTX PRO 6000 Blackwell වැනි) VRAM උපරිම කරයි - කාඩ්පතකට GB 96ක් දක්වා - නමුත් ගණනය කිරීමේ ඒකකයකට වැඩි පිරිවැයක් ගනී.
VRAM යනු බැඳී ඇති සීමාවයි. ප්රමාණවත් මතකයක් නොමැතිව වේගවත් කාඩ්පතකට AI ආකෘතිය පූරණය කළ නොහැක. ප්රමාණවත් මතකයක් සහිත මන්දගාමී කාඩ්පතක් ආකෘතිය ක්රියාත්මක කරයි - නමුත් දිගු ප්රතිචාර කාල සමඟ.
පාරිභෝගික GPU
| වින්යාසය | සම්පූර්ණ VRAM | සම්බන්ධ කිරීම | ඇස්ත. පිරිවැය |
|---|---|---|---|
| 2× RTX 3090 (පාවිච්චි කළ) | 48 GB | NVLink | රු. 9.2 ලක්ෂ |
| 2× RTX 4090 | 48 GB | PCIe Gen 5 | රු. 12.3 ලක්ෂ |
| 2× RTX 5090 | 64 GB | PCIe Gen 5 | රු. 21.6 ලක්ෂ |
වෘත්තීය GPU
| වින්යාසය | සම්පූර්ණ VRAM | සම්බන්ධ කිරීම | ඇස්ත. පිරිවැය |
|---|---|---|---|
| 2× RTX A6000 හොඳම වටිනාකම | 96 GB | NVLink | රු. 21.6 ලක්ෂ |
| 2× RTX 6000 Ada | 96 GB | PCIe Gen 5 | රු. 40 ලක්ෂ |
| 1× RTX PRO 6000 Blackwell | 96 GB | NVLink | ~රු. 24.6 ලක්ෂ |
| 4× RTX PRO 6000 Blackwell | 384 GB | PCIe Gen 5 | රු. 98.6 ලක්ෂ |
දත්ත කේන්ද්ර GPU
| වින්යාසය | සම්පූර්ණ VRAM | සම්බන්ධ කිරීම | ඇස්ත. පිරිවැය |
|---|---|---|---|
| 1× L40S | 48 GB | PCIe 4.0 (නිෂ්ක්රීය සිසිලනය) | රු. 21.6 ලක්ෂ |
| 1× A100 PCIe | 80 GB | PCIe 4.0 | රු. 30.8 ලක්ෂ |
| 1× H200 NVL | 141 GB | NVLink | රු. 92.4 ලක්ෂ |
| 4× H200 NVL | 564 GB | NVLink | රු. 3.7 කෝටි |
| 1× B200 SXM | 180 GB | NVLink 5 (1.8 TB/s) | රු. 92.4 ලක්ෂ |
| 8× B200 SXM | 1,440 GB | NVLink 5 (1.8 TB/s) | රු. 7.4 කෝටි |
චීන GPU
චීනයේ දේශීය GPU පරිසර පද්ධතිය වේගයෙන් පරිණත වී ඇත. චීන නිෂ්පාදක කිහිප දෙනෙක් දැන් තරඟකාරී පිරිවිතර සහ සැලකිය යුතු ලෙස අඩු මිලකට වැඩස්ථාන-පන්ති AI GPU ලබා දෙයි.
| වින්යාසය | සම්පූර්ණ VRAM | මතක වර්ගය | ඇස්ත. පිරිවැය |
|---|---|---|---|
| 1× Moore Threads MTT S4000 | 48 GB | GDDR6 | රු. 2.5 ලක්ෂ |
| 4× Moore Threads MTT S4000 | 192 GB | GDDR6 | රු. 10.8 ලක්ෂ |
| 8× Moore Threads MTT S4000 | 384 GB | GDDR6 | රු. 20 ලක්ෂ |
| 1× Hygon DCU Z100 | 32 GB | HBM2 | රු. 7.7 ලක්ෂ |
| 1× Biren BR104 | 32 GB | HBM2e | රු. 9.2 ලක්ෂ |
| 8× Biren BR104 | 256 GB | HBM2e | රු. 73.9 ලක්ෂ |
| 1× Huawei Ascend Atlas 300I Duo | 96 GB | HBM2e | රු. 3.7 ලක්ෂ |
| 8× Huawei Ascend Atlas 300I Duo | 768 GB | HBM2e | රු. 30.8 ලක්ෂ |
ඉදිරියේදී
| වින්යාසය | සම්පූර්ණ VRAM | තත්ත්වය | ඇස්ත. පිරිවැය |
|---|---|---|---|
| RTX 5090 128 GB | 128 GB | චීන වෙනස් කිරීම — සම්මත SKU එකක් නොවේ | රු. 15.4 ලක්ෂ |
| RTX Titan AI | 64 GB | 2027 දී අපේක්ෂිතයි | රු. 9.2 ලක්ෂ |
NVIDIA DGX Station
ව්යවසාය Apex
NVIDIA DGX Station යනු ජල-සිසිලනය වන, අසල්වැසි සුපර් පරිගණකයක්
වන අතර එය දත්ත කේන්ද්ර කාර්ය සාධනය කාර්යාල පරිසරයකට ගෙන එයි. නවතම අනුවාදය GB300 Grace Blackwell Superchip භාවිතා කරයි.
Blackwell Ultra
අනුවාදය මතක ඝනත්වය සහ ගණනය කිරීමේ බලය වැඩි කරයි, එය අභිමත ආකෘති ආරම්භයේ සිට පුහුණු කිරීමට හෝ විශාල MoE (Mixture of Experts) ගෘහනිර්මාණ ශිල්ප ප්රාදේශීයව ක්රියාත්මක කිරීමට අවශ්ය සංවිධාන සඳහා නිර්මාණය කර ඇත.
පෙර පරම්පරාවේ ඇම්පියර් ගෘහනිර්මාණ ශිල්පය මත පදනම් වුවද, එය විශ්වසනීය අනුමාන සහ සුක්ෂම සීරුමාරු කිරීම් සඳහා කර්මාන්ත ප්රමිතිය ලෙස පවතී. බ්ලැක්වෙල් සඳහා අයවැයක් නොමැතිව AI අවකාශයට ඇතුළු වන කණ්ඩායම් සඳහා ඉතා සුදුසුය.
මිල අධික වුවද, DGX Station එක ~රු. 9.2 කෝටි සේවාදායක රාක්කයක් සහ ඊට අනුබද්ධ සිසිලන යටිතල පහසුකම් ආදේශනය කරයි. එය සම්මත බිත්ති සොකට් එකකට සම්බන්ධ වේ. මෙය සේවාදායක කාමරයේ
අතිරේක වියදම සම්පූර්ණයෙන්ම ඉවත් කරයි.
ඔබේ ව්යාපාරය සඳහා සුදුසු AI වැඩස්ථානය තෝරා ගැනීමට උදව් අවශ්යද?
අපගේ ඉංජිනේරුවන්ට ඔබේ AI දෘඩාංග අවශ්යතා තක්සේරු කිරීමට සහ සම්පූර්ණයෙන් වින්යාසගත කරන ලද AI පද්ධතියක් ස්ථාපනය කිරීමට හැකියාව ඇත.
නොමිලේ දෘඩාංග තක්සේරුවක් ලබා ගන්න →5 සේවාදායකAI සේවාදායක
AI සර්වර් රු. 46.2 ලක්ෂ - රු. 6.16 කෝටි
ඔබේ ව්යාපාරයට එකවරම බොහෝ සේවකයින් සේවය කිරීමට, පදනම්-පන්ති ආකෘති සම්පූර්ණ නිරවද්යතාවයෙන් ධාවනය කිරීමට, හෝ අයිතිවාසිකම් දත්ත මත අභිරුචෘති සුක්ෂම සීරුමාරු කිරීමට අවශ්ය වූ විට — ඔබ සේවාදායක පෙළට ඇතුළු වේ.
මෙය ඉහළ-පළල මතක (HBM), විශේෂිත අන්තර් සම්බන්ධක සහ රාක්-සවි කළ හැකි හෝ අසල්වැසි ස්වරූප සාධක සහිත විශේෂිත AI ත්වරක කාඩ්පත් වල වසමයි. දෘඩාංග වඩාත් මිල අධික වුවද, පරිශීලකයාට ඒකකයක පිරිවැය විශාල පරිමාණයකින් අඩු වේ.
Intel Gaudi 3
පරිමාණයෙන් හොඳම වටිනාකම
Intel Gaudi 3 ත්වරකය ආරම්භයේ සිටම AI පුහුණුව සහ අනුමාන චිප් ලෙස නිර්මාණය කර ඇත - නැවත භාවිතා කරන ලද ග්රැෆික් කාඩ්පතක් නොවේ. එක් එක් කාඩ්පත අනුකූල 400 Gb ඊතර්නෙට් ජාලකරණය සමඟ GB 128ක HBM2e මතකයක් ලබා දෙයි, එමඟින් වෙනම ජාල අනුකරණ අවශ්යතාවය ඉවත් කරයි.
ගෞඩි 3 ආකෘති සාධක දෙකකින් ලබා ගත හැකිය:
- PCIe කාඩ්පත (HL-338): පවතින සේවාදායකයන් තුළට ඒකාබද්ධ කිරීම සඳහා සම්මත PCIe ආකෘති සාධකයකි. ඇස්තමේන්තුගත මිල: කාඩ්පතකට ~රු. 37 ලක්ෂ.
- OAM (OCP ත්වරක මොඩියුලය): වලාකුළු දත්ත කේන්ද්ර සඳහා අධි-ඝනත්ව OCP ප්රමිතියකි. තොග 8-චිප කට්ටල මිලදී ගන්නා විට චිපයකට රු. 48.1 ලකෂ (පාදක පුවරුව සමඟ සම්පූර්ණ ~රු. 3.8 කෝටි).
කාඩ්පත් 8 කින් යුත් ගෞඩි 3 සේවාදායකයක්, සැසඳිය හැකි NVIDIA H100 පද්ධතියකට වඩා බෙහෙවින් අඩු පිරිවැයකින් 1 TB AI මතකයක් සපයයි.
AMD Instinct MI325X
උපරිම ඝනත්වය
AMD Instinct MI325X කාඩ්පතකට HBM3e මතකය GB 256 ක් ඇසුරුම් කරයි — ඉන්ටෙල් ගෞඩි 3 ට වඩා දෙගුණයකි. ඉන්ටෙල් සඳහා කාඩ්පත් 8 ක් අවශ්ය වන අතර, සම්පූර්ණ AI මතකය 1 TB දක්වා ලබා ගැනීමට කාඩ්පත් 4 ක් පමණක් අවශ්ය වේ.
MI325X එක පද්ධතියකට ගෞඩි 3 ට වඩා මිල අධිකයි, නමුත් වේගවත් හා ඝනත්වයෙන් අධිකයි. උපරිම ධාරිතාව අවශ්ය වැඩ භාරයන් සඳහා — වැඩි පරිශීලකයින් සඳහා තාත්වික-කාලීන අනුමාන, හෝ විශාල දත්ත කට්ටල මත අභිරුචි ආකෘති පුහුණු කිරීම — ඉහළ ආයෝජනය අඩු ප්රමාදය සහ සරල යටිතල පහසුකම් මගින් තමන්ව ගෙවා ගනී.
Huawei Ascend
සම්පූර්ණ-ස්ථර විකල්පය
Huawei සම්පූර්ණ AI යටිතල පහසුකම් ස්ථරය පිටපත් කර ඇත: අභිරුචි සිලිකන් (Ascend 910B/C), අයිතිවාසිකම් සහිත අන්තර් සම්බන්ධක (HCCS), සහ සම්පූර්ණ මෘදුකාංග රාමුවක් (CANN). ප්රතිඵලය වන්නේ බටහිර සැපයුම් දාමවලින් ස්වාධීනව ක්රියා කරන සහ සමාන NVIDIA H100 කලාප වලට වඩා බෙහෙවින් අඩු පිරිවැයකින් ක්රියාත්මක වන ස්වයං-පූර්ණ පරිසර පද්ධතියකි.
Intel Xeon 6 (Granite Rapids)
අයවැය සර්වර්
2026 දී නිහඬ විප්ලවයක් වන්නේ CPU-මත පදනම් වූ AI අනුමානයේ නැගීමයි. Intel Xeon 6 සැකසුම්කාරක AMX (Advanced Matrix Extensions) අඩංගු කරයි, එමඟින් සම්මත DDR5 RAM මත AI වැඩබරකම් ක්රියාත්මක කිරීමට හැකියාව ලබා දෙයි - එය GPU මතකයට වඩා බෙහෙවින් අඩු මිලකට ලබා ගත හැකිය.
ද්විත්ව-සොකට් Xeon 6 සර්වරයකට GPU මතකයේ පිරිවැයෙන් කොටසක් වශයෙන් DDR5 RAM GB 1 සිට GB 4 දක්වා තබා ගත හැකිය. අනුමාන වේගයන් මන්දගාමී වේ, නමුත් කණ්ඩායම් සැකසුම් සඳහා — වේගය අදාළ නොවන නමුත් බුද්ධිමත් භාවය සහ ධාරිතාව ඉතා වැදගත් වන — මෙය පරිවර්තනාත්මක වේ.
උදාහරණය: SMB එකක් රාත්රියේ අයවැය පත්ර 100,000ක් උඩුගත කරයි. Xeon 6 සර්වරය දත්ත පරිපූර්ණව උකහා ගැනීමට +400B AI ආකෘතියක් ක්රියාත්මක කරයි. කාර්යයට පැය 10ක් ගත වුවද, දෘඩාංග පිරිවැය GPU සර්වරයකට වඩා බෙහෙවින් අඩුයි.
සුදුසු AI සර්වර් යටිතල පහසුකම් තෝරා ගැනීමට උදව් අවශ්යද?
අපගේ යටිතල පද්ධති කණ්ඩායම AI සර්වර් විසඳුම් සම්පූර්ණයෙන්ම නිර්මාණය කරයි සහ අනුස්ථාපනය කරයි — Intel Gaudi සිට NVIDIA DGX දක්වා — අභිරුචි මෘදුකාංග සමඟ ඒකාබද්ධව — ඔබේ ව්යාපාරය සඳහා AI හි හැකියාවන් අගුළු හරිනු පිණිස.
සර්වර් ගෘහනිර්මාණ ශිල්ප කලාපයක් ඉල්ලා සිටින්න →6 එජ් AI
එජ් AI & ප්රතිසංස්කරණය පවතින යටිතල පද්ධති උසස් කිරීම
සෑම කුඩා හා මධ්යම ව්යාපාරයකටම වෙන් කරන ලද AI සර්වරයක් හෝ මිනි-පීසී එකක් අවශ්ය නොවේ. බොහෝ දෙනෙක් තම පවතින යටිතල පද්ධතියට බුද්ධිමත්භාවය ඇතුළත් කළ හැකිය — AI හැකියාවන් සමඟ ලැප්ටොප්, ඩෙස්ක්ටොප් සහ ජාල උපාංග අවම වියදමකින් උසස් කිරීමෙනි.
M.2 AI ත්වරක: Hailo-10
Hailo-10 යනු සම්මත M.2 2280 මොඩියුලයකි — SSD සඳහා භාවිතා කරන එකම ස්ලොට් එක — ඕනෑම පවතින PC එකකට විශේෂිත AI සැකසුම් එකතු කරයි. ඒකකයකට ~~රු. 46,200 වන අතර බලය 5–8W පමණ පමණක් පරිභෝජනය කර දෘඩාංග ප්රතිස්ථාපනය නොකරම ගොවිපල පුරා AI උසස් කිරීම් සක්රීය කරයි.
භාවිතා අවස්ථා: ප්රාදේශීය රැස්වීම් පිටපත් කිරීම (Whisper), තත්පර ගණන් කිරීම, හඬ නිර්දේශ කිරීම, කුඩා ආකෘති අනුමාන කිරීම (Phi-3 Mini). මෙම කාඩ්පත් විශාල LLM ධාවනය කළ නොහැක, නමුත් ඒවා විශේෂිත, අඛණ්ඩ AI කාර්යයන්හි දක්ෂ වේ — හඬ දත්ත දේශීයව සැකසෙන බවට සහතික කරයි සහ කිසි විටෙකත් වලාකුළු වෙත යවනු නොලැබේ.
Copilot+ පීසී (NPU ලැප්ටොප්)
Qualcomm Snapdragon X Elite, Intel Core Ultra, හෝ AMD Ryzen AI චිප සහිත ලැප්ටොප් වල සමර්පිත ස්නායුක සැකසුම් ඒකක (NPU) — විශේෂිත AI චිප අඩංගු වේ. මේවා විශාල LLM ධාවනය කළ නොහැකි නමුත්, කුඩා, අඛණ්ඩ AI කාර්යයන් හැසිරවීමට හැකියාව ඇත: සජීවී පිටපත් කිරීම, පසුබිම අස්පෝෂණය, දේශීය Recall
විශේෂාංග, සහ Microsoft Phi-3 වැනි සැහැල්ලු ආකෘති ධාවනය කිරීම.
NPU ශ්රේණිගත කරනු ලබන්නේ TOPS (ටෙරා මෙහෙයුම් තත්පරයට) වලින් වන අතර, එය ඒවාට හසුරුවා ගත හැකි AI කාර්ය ප්රමාණය මනිනු ලබයි. 2026 දී ඇති වඩාත්ම බලවත් Copilot+ පරිගණකවල TOPS ~50 ක් පමණ ඇත. TOPS ඉහළ යාම යනු වේගවත් ප්රතිචාර සහ තරමක් විශාල AI ආකෘති හසුරුවා ගැනීමේ හැකියාවයි.
9 AI ආකෘති
විවෘත-මූල AI ආකෘති (2026–2027)
AI ආකෘතියේ තේරීම දෘඩාංග අවශ්යතා තීරණය කරයි — නමුත් AI ආකෘති ක්වන්ටිකරණය පිළිබඳ පරිච්ඡේදයෙන් පෙන්වා ඇති පරිදි, ක්වන්ටිකරණය මගින් ප්රමුඛ පෙලේ ආකෘති සම්පූර්ණ-නිරවද්යතා අනුස්ථාපනයට අවශ්ය දෘඩාංග වියදමෙන් කොටසක් වැනි දෘඩාංග මත ධාවනය කිරීමට හැකි වේ.
පහත වගුව වර්තමාන හා ඉදිරියේදී පැමිණන විවෘත මූලාශ්ර AI ආකෘති පිළිබඳ දළ විශ්ලේෂණයක් ලබා දෙයි.
| ආකෘතිය | ප්රමාණය | ගෘහනිර්මාණ ශිල්පය | මතකය (FP16) | මතකය (INT4) |
|---|---|---|---|---|
| Llama 4 Behemoth | 288B (සක්රීය) | MoE (~2T සම්පූර්ණ) | ~4 TB | ~1 TB |
| Llama 4 Maverick | 17B (සක්රීය) | MoE (400B සම්පූර්ණ) | ~800 GB | ~200 GB |
| Llama 4 Scout | 17B (සක්රීය) | MoE (109B සම්පූර්ණ) | ~220 GB | ~55 GB |
| DeepSeek V4 | ~70B (සක්රීය) | MoE (671B සම්පූර්ණ) | ~680 GB | ~170 GB |
| DeepSeek R1 | 37B (සක්රීය) | MoE (671B සම්පූර්ණ) | ~140 GB | ~35 GB |
| DeepSeek V3.2 | ~37B (සක්රීය) | MoE (671B සම්පූර්ණ) | ~140 GB | ~35 GB |
| Kimi K2.5 | 32B (සක්රීය) | MoE (1T සම්පූර්ණ) | ~2 TB | ~500 GB |
| Qwen 3.5 | 397B (සක්රීය) | MoE (A17B) | ~1.5 TB | ~375 GB |
| Qwen 3-Max-Thinking | විශාල | සාන්ද්ර | ~2 TB | ~500 GB |
| Qwen 3-Coder-Next | 480B (A35B සක්රීය) | MoE | ~960 GB | ~240 GB |
| Mistral Large 3 | 123B (41B සක්රීය) | MoE (675B සම්පූර්ණ) | ~246 GB | ~62 GB |
| Ministral 3 (3B, 8B, 14B) | 3B–14B | සාන්ද්ර | ~6–28 GB | ~2–7 GB |
| GLM-5 | 44B (සක්රීය) | MoE (744B සම්පූර්ණ) | ~1.5 TB | ~370 GB |
| GLM-4.7 (Thinking) | විශාල | සාන්ද්ර | ~1.5 TB | ~375 GB |
| MiMo-V2-Flash | 15B (සක්රීය) | MoE (309B සම්පූර්ණ) | ~30 GB | ~8 GB |
| MiniMax M2.5 | ~10B (සක්රීය) | MoE (~230B සම්පූර්ණ) | ~460 GB | ~115 GB |
| Phi-5 Reasoning | 14B | සාන්ද්ර | ~28 GB | ~7 GB |
| Phi-4 | 14B | සාන්ද්ර | ~28 GB | ~7 GB |
| Gemma 3 | 27B | සාන්ද්ර | ~54 GB | ~14 GB |
| Pixtral 2 Large | 90B | සාන්ද්ර | ~180 GB | ~45 GB |
| Stable Diffusion 4 | ~12B | DiT | ~24 GB | ~6 GB |
| FLUX.2 Pro | 15B | DiT | ~30 GB | ~8 GB |
| Open-Sora 2.0 | 30B | DiT | ~60 GB | ~15 GB |
| Whisper V4 | 1.5B | සාන්ද්ර | ~3 GB | ~1 GB |
| Med-Llama 4 | 70B | සාන්ද්ර | ~140 GB | ~35 GB |
| Legal-BERT 2026 | 35B | සාන්ද්ර | ~70 GB | ~18 GB |
| Finance-LLM 3 | 15B | සාන්ද්ර | ~30 GB | ~8 GB |
| CodeLlama 4 | 70B | සාන්ද්ර | ~140 GB | ~35 GB |
| Molmo 2 | 80B | සාන්ද්ර | ~160 GB | ~40 GB |
| Granite 4.0 | 32B (9B සක්රීය) | හයිබ්රිඩ් Mamba-Transformer | ~64 GB | ~16 GB |
| Nemotron 3 | 8B, 70B | සාන්ද්ර | ~16–140 GB | ~4–35 GB |
| EXAONE 4.0 | 32B | සාන්ද්ර | ~64 GB | ~16 GB |
| Llama 5 Frontier | ~1.2T (සම්පූර්ණ) | MoE | ~2.4 TB | ~600 GB |
| Llama 5 Base | 70B–150B | සාන්ද්ර | ~140–300 GB | ~35–75 GB |
| DeepSeek V5 | ~600B (සම්පූර්ණ) | MoE | ~1.2 TB | ~300 GB |
| Stable Diffusion 5 | TBD | DiT | — | — |
| Falcon 3 | 200B | සාන්ද්ර | ~400 GB | ~100 GB |
පළමුව දෘඩාංග මිලදී නොගන්න. ඔබේ ව්යාපාර අවශ්යතාවලට ගැළපෙන ආකෘති පන්තිය හඳුනා ගන්න, ඉන්පසු වඩාත්ම අඩු වියදම් දෘඩාංග තට්ටුව තීරණය කිරීමට ක්වන්ටිකරණය යොදන්න.
රු. 9.2 ලක්ෂ සහ රු. 4.6 කෝටි ආයෝජනයක් අතර වෙනස බොහෝ විට ආකෘතිරමාණ අවශ්යතා සහ එකවර භාවිතා කරන පරිශීලකයින් ගණන මත රඳා පවතී.
AI ආකෘති භූමිය හැඩගස්වන ප්රවණතා
- සම්මතය ලෙස ස්වභාවික බහු-මාධ්ය. නව ආකෘති පාඨය, රූප, ශ්රව්ය සහ වීඩියෝ මත එකවර පුහුණු කරනු ලැබේ — පුහුණුවෙන් පසු එකතු කරන ලද වෙනස් හැකියාවන් ලෙස නොවේ. මෙයින් අදහස් කරන්නේ තනි ආකෘතියක් ලේඛන විශ්ලේෂණය, රූප අවබෝධය සහ හඬ අන්තර්ක්රියාව හසුරුවන බවයි.
- කුඩා ආකෘති විශාල-ආකෘති හැකියාවන් සාක්ෂාත් කර ගැනීම. Phi-5 (14B) සහ MiMo-V2-Flash ගෘහනිර්මාණ ශිල්ප නවෝත්පාදනය මගින් ප්රමුඛ-පෙලේ තර්කනය ලැප්ටොප් එකක ධාවනය වන ආකෘතිවලට සම්පීඩනය කළ හැකි බව පෙන්වයි. "විශාලය හොඳය" යන යුගය අවසන් වෙමින් පවතී.
- සාමාන්යකරණයට වඩා විශේෂාංගකරණය. සියල්ල සඳහා එක් විශාල ආකෘතියක් වෙනුවට, ප්රවණතාව විශේෂිත ආකෘති සමූහයක් දෙසට යොමු වේ — කේතන ආකෘතියක්, තර්කන ආකෘතියක්, දර්ශන ආකෘතියක් — ඒජන්ට් රාමුවක් මගින් සම්බන්ධීකරණය කරනු ලැබේ. මෙය ආකෘතියකට අවශ්ය දෘඩාංග අවශ්යතා අඩු කරන අතර සමස්ත ගුණාත්මකභාවය වැඩි දියුණු කරයි.
- ඒජන්ටික් AI. Kimi K2.5 සහ Qwen 3 වැනි ආකෘති සංකීර්ණ කාර්යයන් ස්වාධීනව විඝටනය කිරීමට, බාහිර මෙවලම් භාවිතා කිරීමට සහ වෙනත් ආකෘති සමඟ සම්බන්ධීකරණය කිරීමට සැලසුම් කර ඇත. මෙම
ඒජන්ට් රැළ
පරාදිග්මය දිගු සැසිවාරවලදී අඛණ්ඩ තීව්රතාවයක් ඉල්ලා සිටී — GB10 සහ M5 Ultra වැනි ඉහළ-පළලින් යුත් දෘඩාංග වලට ප්රතිපක්ෂ වේ. - වීඩියෝ සහ 3D ජනනය පරිණත වීම. Open-Sora 2.0 සහ FLUX.2 Pro පෙන්නුම් කරන්නේ දේශීය වීඩියෝ ජනනය ප්රායෝගික වීමට පටන් ගෙන ඇති බවයි. 2027 වන විට, වැඩසටහන්-පන්ති දෘඩාංග මත ක්රියාත්මක වන තත්පර ගණන් වීඩියෝ සංස්කරණ සහායකයින් බපොරොත්තු විය හැකිය.
10 ආරක්ෂාව
උපරිම ආරක්ෂාව සඳහා ගෘහනිර්මාණ ශිල්පය
දේශීය AI දෘඩාංගයේ ප්රාථමික වාසිය කාර්ය සාධනය නොවේ — එය දත්ත ස්වාධීනත්වයයි. ඔබේ AI සේවාදායකය අන් අයගේ වලාකුළුවක ඇති වෙනුවට ඔබේ ගිනි බඩුව පිටුපස ධාවනය වන විට, ඔබේ සංවේදී දත්ත ඔබේ ගොඩනැගිල්ලෙන් පිටතට යන්නේ නැත.
ඇයාර්-ගැප්ඩ් API ගෘහනිර්මාණ ශිල්පය, AI සේවාදායකය අන්තර්ජාලයෙන් භෞතිකව වෙන් කරන අතර, අවසර ලත් සේවකයින්ට API අතුරුමුහුණතක් හරහා ප්රවේශ වීමට ඉඩ සලසයි.
මෙම ගෘහනිර්මාණ ශිල්පය ඩිජිටල් ගබඩාවක්
නිර්මාණය කරයි. බ්රෝකර් සර්වරය අනතුරට පත් වුවද, ප්රහාරකයෙකුට පෙළ විමසුම් පමණක් යැවිය හැකිය — ඔවුන්ට AI සර්වරයේ ගොනු පද්ධතිය, ආකෘති බර, හොඳින්-සකස් කිරීමේ දත්ත, හෝ ගබඩා කර ඇති ලේඛන වලට ප්රවේශ විය නොහැකිය.
අභිරුචි AI විසඳුම් සහිත ආරක්ෂිත AI අනුස්ථාපනයක් අවශ්යද?
අපගේ ඉංජිනේරුවන් අභිරුචි AI ගෘහනිර්මාණ ශිල්ප සැලසුම් කර අනුස්ථාපනය කරයි, ඔබේ ව්යාපාරයට නවීන AI හැකියාවන් සපයන අතරම දත්ත කිසි විටෙකත් පරිශ්රයෙන් පිටතට නොයන බව සහතික කරයි.
ආරක්ෂිත AI ගෘහනිර්මාණ ශිල්පය සාකච්ඡා කරන්න →11 ආර්ථිකය
ආර්ථික තීන්දුව: ස්ථානීය එදිරිව වලාකුළු
දේශීය AI දෘඩාංග වෙත සංක්රමණය OpEx (ක්රියාකාරී වියදම් — මාසික වලාකුළු API ගාස්තු) සිට CapEx (ධන වියදම් — ඔබේ ශේෂ පත්රයේ වත්කමක් බවට පත්වන එක් වරක දෘඩාංග ආයජනයක්) වෙත මාරුවීමකි.
ගිවිසුම් විශ්ලේෂණය කිරීම සඳහා 200B ආකෘතියක් ධාවනය කරන නීති සමාගමක් සලකා බලන්න:
දිනකට විමසුම් 1,000 ක් සමඟ, DGX Spark එක වලාකුළු API පිරිවැය සමඟ සසඳන විට මාස 2 ට අඩු කාලයකින් තමන්ව ගෙවා ගනී. ඉහළ භාවිත මට්ටම්වලදී, බ්රේක්-ඉවන් කාලය සති කිහිපයක් දක්වා කෙටි වේ.
ඔබ සලකා බලන විට ආර්ථික වාසිටත් වඩා හොඳ වේ:
- බහු සේවකයින් එකම දෘඩාංග බෙදා ගැනීම (DGX Spark එක එකවර පරිශීලකයින් 2–5 දෙනෙකුට සේවය කරයි)
- ටෝකනයකට මිල නැත — සංකීර්ණ, බහු-පියවර තර්කන කාර්යයන්ට අතිරේක වියදමක් නැත
- අයිතිවාසිකම් දත්ත මත හොඳින්-සකස් කිරීම — බොහෝ වලාකුළු API සමඟ කළ නොහැකි, දේශීය දෘඩාංග මත නොමිලේ
- දෘඩාංග නැවත විකිණීමේ වටිනාකම — AI දෘඩාංග ද්විතීයික වෙළඳපොලෙහි සැලකිය යුතු වටිනාකමක් රඳවා තබා ගනී