ניוריאליטי שולחת לייצור את השרת על שבב הראשון בעולם להסקה בתחום ה-AI

חברת סטארט-אפ ה-AI ניוריאליטי (NeuReality), המפתחת פתרונות הסקה (inference) עתירי ביצועים, הודיעה כי שבב ה-NR1 פרי פיתוחה בטכנולוגיית 7 ננו מטר סיים את שלב התכנון ועבר את כל הבדיקות בהצלחה ועובר עתה למפעלי TSMC לייצור שבב ה-AI הראשון בעולם מסוג שרת הסקת-AI-על-שבב (SOC – Server-on-a-Chip). המעבר לייצור או בשמו המקצועי, הטייפ-אאוט (tape-out) של השבב הוא צעד גדול קדימה לתעשיית הסמיקונדקטורים מכיוון שבאמצעותו מחוללת ניוריאליטי שינוי מהותי בתחום פתרונות ההסקה לענף ה-AI המשמשים מגוון רחב של אפליקציות, החל מעיבוד שפה טבעית, דרך ראייה ממוחשבת, זיהוי דיבור וכלה במערכות המלצה.

לאור האימוץ הנרחב של AI בשירותי ענן (AIaaS – AI as a Service) ובשל התפתחות אפליקציות כמו ChatGPT השואבות משאבי תשתית גדולים, הפתרון של ניוריאליטי הוא קריטי עבור תעשייה הזקוקה לגישה לתשתית הסקה של AI במחירים ברי השגה. בניסויים שבוצעו עם מערכות שרתים מבוססות AI הפגין שבב NR1 של ניוריאליטי ביצועים חזקים פי 10 ובעלות זהה ביחס למערכות מסורתיות מבוססות הארכיטקטורה המסורתית מסוג CPU-centric. התוצאות יוצאות הדופן הללו מכתירות את הטכנולוגיה של ניוריאליטי כמובילה במדדי עלות-תועלת וצריכת-הספק-תועלת וכך גם בביצועים אבסולוטיים בתחום ההסקה של AI.

פתרונות הסקה ל-AI דורשים באופן מסורתי עיבוד עתיר משאבים בתוכנה שכרוך בעלויות גבוהות. המעבר של ניוריאליטי משלב התכנון לשלב הייצור, מציין תחילת עידן חדש של שרתים מבוססי ארכיטקטורת AI-centric, אינטגרטיבית יותר, זולה יותר המאפשרת פריסה רחבה הרבה יותר של אפליקציות מבוססות AI.

משה תנך, מנכ”ל ומייסד משותף של NeuReality, מסר: “מעבד ה-NR1 הוא ה-NAPU הראשון בעולם (NAPU – Network Addressable Processing Units) שמהווה חלופה לגישה הקלאסית הישנה של מערכות שרתים מבוססות CPU עבור הסקת AI. כדי לאפשר למאיצי למידה עמוקה לבצע הסקה בנפח מלא, ללא צווארי הבקבוק הקיימים כיום במערכת סביב מעבדי ה AI הכרוכים גם בתקורות גבוהות, הפתרון שלנו שמתאים לאינטגרציה עם כל טכנולוגיית DLA קיימת (Deep Learning Accelerators) יעבד במהירות גבוהה יותר וביעילות רבה יותר בקשות לשירותי AI”.

“כשמשווים פונקציה מול פונקציה של מערכות, חומרה תמיד רצה מהר יותר וזול יותר מאשר תוכנה, בזכות היכולת לבצע משימות במקביל ובאופן טוב יותר. כתעשייה, אימתנו כבר את המודל הזה כשהורדנו את משימות העיבוד של רשתות הנוירונים ממעבדי CPU למאיצים של למידה עמוקה (DLAs) כמו GPU ופתרונות ASIC אחרים. ברוח חוק אמדהאל (Amdahl’s law), כעת עלינו להעביר את המיקוד למשימות האחרות במערכות ה-AI על מנת שנוכל להשיג את השיפור המקסימלי בביצועים והעלויות כמו גם בצריכת הספק – וזה בדיוק מה שעשינו בניוריאליטי עבור אפליקציות AI. אנו מציעים חלופה תחרותית ברמה חסרת תקדים לשרתים הכלליים הקיימים ואנו מגדירים לתעשייה סטנדרט התפתחותי שעליה לאמץ כדי לתמוך בשדרוגים הבאים הצפויים בעידן ה-AI”.

ניוריאליטי מניעה את מהלכי התעשייה קדימה ומאפשרת את המעבר מגישה ממוקדת תוכנה לגישה של הורדת משימות עיבוד לחומרה שבה מעבדי NR1 מרובים יבצעו בקלות עיבוד מקבילי וימנעו צווארי בקבוק במערכת. כל מעבד NR1 הוא מכשיר עיבוד הטרוגני מוצמד רשת המכיל כמה סוגים של מנועי עיבוד הניתנים לתכנות, בנוסף מכיל הרכיב ממשק PCIe לאירוח DLA, בקר ממשק רשת (NIC), AI-Hypervisor  המשמש כמנהל העיבוד והעברת הנתונים בין מנועי העיבוד. האצה באמצעות חומרה תוך שימוש בערכת הפיתוח האוטומטית של ניוריאליטי מורידה את החסם בפני ארגונים קטנים, בינוניים וגדולים הזקוקים לביצועים מעולים, צריכת הספק נמוכה ותשתית בת השגה – כמו גם קלות השימוש בשירותי הסקה עבור אפליקציות AI.

משה תנך הוסיף: “אנו נרגשים מהדור הראשון של מוצר ה-NAPU שלנו שהוכח, נבדק ונשלח לייצור. לאחר שהשגנו אבן דרך חשובה זו אנחנו נעים קדימה בתנופה מלאה יחד עם שותפינו ב-TSMC. התוכנית שלנו נשארה ועודנה למסור את המוצר ישירות ללקוחות עד סוף שנת 2023”.

בתמונה – רכיב NR1, קרדיט – NeuReality.

Micro Control Banner
עוד >
CEVA rebrand
Nova Logo
ARM Banner

GOLD PARTNERS