ארכיטקטורת התייחסות WARRP מספקת פתרון מודולרי מקיף המאיץ את פיתוח סביבות ההפרדה המבוססות על RAG
אטלנטה וקמפבל, קליפורניה, 19 בנובמבר 2024 /PRNewswire/ — מ-Supercomputing 2024: WEKA, חברת פלטפורמת הנתונים מבוססת AI, השיקה פתרון ארכיטקטורה של התייחסות חדש כדי לפשט ולשדרג את הפיתוח והיישום של סביבות ההשפעה של AI ארגונית. פלטפורמת התייחסות WEKA AI RAG (WARRP) מספקת למפתחי AI גנראטיביים (GenAI) ולארכיטקטים של ענן תוכנית עיצובית לפיתוח מסגרת תשתית ההשפעה חזקה הכוללת ייצור מחוזק (RAG), טכניקה המשמשת בתהליך ההשפעה של AI כדי לאפשר למודלים גדולים של שפה (LLMs) לאסוף נתונים חדשים ממקורות חיצוניים.

חשיבותו של RAG בבניית פעולות AI בטוחות ואמינות
על פי מחקר אחרון של מגמות AI גלובליות שנערך על ידיS&P Global Market Intelligence , ה-GenAI הופיע במהירות כמודאליות AI המאומצת ביותר, ומעלים את כל יישומי ה-AI האחרים בתאגיד.[1]
אתגר עיקרי שעומד בפני ארגונים בעת הפעלת LLM הוא להבטיח שהם יכולים לשחזר באופן יעיל ולתקשר נתונים חדשים בכל סביבות מרובות וממקורות חיצוניים כדי לסייע בהשפעת AI. RAG היא הטכניקה המובילה להשלכה AI, והיא משמשת כדי לשפר מודלים AI מאומנים על ידי השגת תובנות חדשות ממקורות נתונים חיצוניים בבטחה. שימוש ב-RAG בתהליך ההשפעה יכול לעזור להפחית את ההזיות של מודל AI ולשפר את דיוק הפלט, מהימנות ועושר, ולהפחית את הצורך במחזורי אימון מחדש יקרים.
עם זאת, יצירת סביבות חישוב מוכנות לייצור חזקות שיכולות לתמוך במסגרות RAG בקנה מידה היא מורכבת ומאתגרת, שכן ארכיטקטורות, שיטות עבודה מצוינות, כלים ואסטרטגיות בדיקות עדיין מתפתחות במהירות.
תוכנית מקיפה להאצת ההשפעה
עם WARRP, חברת WEKA הגדירה ארכיטקטורת התייחסות שאינה תלויה בתשתית שניתן לנצל כדי לבנות ולפרוס פתרונות RAG באיכות ייצור וביצועים גבוהים בקנה מידה גדול.
WARRP, שנועד לסייע לארגונים לבנות וליישם במהירות צינורות ההשפעה של AI המבוססים על RAG, מספק תוכנית מקיפה של רכיבים מודולריים שניתן להשתמש בהם כדי לפתח במהירות ולפרוס סביבת ההשפעה של AI ברמה עולמית שאופטימיזציה לניידות עומס העבודה, מרכזי נתונים גלובליים מפוזרים וסביבות מרובות עננים.
ארכיטקטורת ההתייחסות של WARRP מבוססת על תוכנת פלטפורמת נתונים WEKA® הפועלת על חומרי הענן או השרת המועדפים של הארגון בתור השכבה הבסיסית שלה. לאחר מכן הוא משלב מסגרות AI ארגוני מובילות מעמד מ NVIDIA כולל: NVIDIA NIM™ מיקרו-שירותים ו NVIDIA NeMo ™Retriever, שני החלקים של NVIDIA AI Enterprise פלטפורמה מתקדמת של עומס עבודה של תוכנת AI ויכולות תזמורת GPU מ –Run:ai טכנולוגיות תוכנה פופולריות לניהול נתונים מסחריים ופתוחים כמו Kubernetes עבור תזמורת נתונים, ו- Milvus Vector DB עבור אכילת נתונים.
כאשר גל הראשון של טכנולוגיות AI גנראטיביות החל לעבור אל הארגון בשנת 2023, “משאבי תשתית החישוב והנתונים של רוב הארגונים התמקדו בהכשרת מודל AI. ככל שמודלים ויישומים של GenAI מתבגרים, ארגונים רבים מתכוננים כעת להעביר את המשאבים האלה כדי להתמקד בהשפעה, אבל אולי לא יודעים מאיפה להתחיל”, אמר Shimon Ben-David, מנהל הטכנולוגיה הראשי ב-WEKA. “הריצה של חישוב AI בקנה מידה היא מאתגרת ביותר. אנו מפתחים את פלטפורמת ארכיטקטורה WEKA AI RAG על פתרונות תשתיות AI וענן מובילים מהחברות WEKA, NVIDIA, Run:ai, Kubernetes, Milvus ונוספות כדי לספק תוכנית חזקה מוכנה לייצור אשר מקשטת את תהליך יישום RAG כדי לשפר את הדיוק, האבטחה ואת העלות של הפעלת מודלים AI ארגוניים.”
WARRP מספקת מסגרת גמישה ומודולרית שיכולה לתמוך במגוון של יישומי LLM, ומציעה גדלות, הסתגלות וביצועים יוצאי דופן בסביבות ייצור. ההטבות העיקריות כוללות:
- בניית סביבת ההפרדה מוכנה לייצור מהיר יותר: תשתית של WARRP וארכיטקטורת ענן-אגנוסטית יכולה לשמש על ידי מפתחי GenAI וארכיטקטים ענן כדי לייעל את פיתוח יישומי GenAI ולהפעיל פעולות ההשלכה בקנה מידה מהיר יותר. הוא משתלב בצורה חלקה עם רכיבי תשתית AI הקיימים והעתידיים של ארגון, מודלים של שפות גדולות וקטנות, וספקי ענן AI המועדפים, בקנה מידה גדול או מתמחים, ומעניק לארגונים גמישות ובחירה יוצאת דופן בארכיטקטורת העריכה של AI שלהם.
- חומרה, תוכנה ואגנוסטיות לענן: העיצוב המודולרי של WARRP תומך ברוב ספקי השירותים העיקריים של שרתים ועננים. הארכיטקטורה מאפשרת לארגונים להשיג בקלות את יכולת העברת עומס העבודה ללא פגיעה ביצועים על ידי כך שמטפלי AI יכולים להפעיל את אותו עומס העבודה על פלטפורמת הענן בקנה המידה הגדול המועדפת עליהם, שירות ענן AI או חומרה של שרת מקומי עם שינויים מינימליים בתצורה. בין אם הם מופעלים בסביבת ענן ציבורית, פרטית או היברידית, צינורות AI מראים התנהגות יציבה ותוצאות צפויות, ומפשטים פעולות היברידיות ומולטי-ענן.
- אופטימיזציה של ערימת AI מקצה לקצה: הפעלת צינורות RAG יכולה להיות תובענית מאוד, במיוחד כאשר מתמודדים עם מאגרי מודלים גדולים ועומסי עבודה AI מורכבים. ארגונים יכולים להשיג שיפורים משמעותיים בביצועים על ידי שילוב של פלטפורמת הנתונים של WEKA לתוך ערימת ההשפעה של AI שלהם, במיוחד בתרחישי ההשפעה הרב-מודל. היכולת של פלטפורמת הנתונים WEKA להטעין ולפרוק מודלים ביעילות מאיצה עוד יותר ומספקת ביעילות טוקנים עבור דרישות המשתמש, במיוחד בזרמי עבודה מורכבים וקשורים המעורבים במודלים AI מרובים.
“כאשר אימוץ AI מאיץ, יש צורך קריטי בדרכים מפשטות לפרוס עומסי עבודה בייצור בקנה מידה גדול. בינתיים, ההשלכה המבוססת על RAG מתפתחת כגבול חשוב במירוץ החדשנות של AI, ומביאה שיקולים חדשים לתשתית הנתונים הבסיסית של ארגון”, אמר Ronen Dar, מנהל הטכנולוגיה הראשי ב- Run:ai. “ארכיטקטורת ההתייחסות של WARRP מספקת פתרון מעולה ללקוחות הבונים סביבת ההשפעה, ומספקת תכנון חיוני שיעזור להם לפתח במהירות, בגמישות ובבטחה באמצעות רכיבים מובילים בתעשייה מ-NVIDIA, WEKA ו- Run:ai כדי למקסם את ניצול ה- GPU בסביבות ענן פרטיות, ציבוריות והיברידיות. שילוב זה הוא מועיל לכולם, עבור לקוחות שרוצים להתעלות על התחרות שלהם על קצה החיתוך של חדשנות AI.”
“תאגידים מחפשים דרך פשוטה להטמיע את הנתונים שלהם כדי לבנות ולפרוס צינורות RAG“, אמרה Amanda Saunders, מנהלת תוכנת מנהל תוכנת AI ארגונית ב-NVIDIA. “שימוש ב-NVIDIA NIM ו-NeMo עם WEKA, ייתן ללקוחות ארגוניים נתיב מהיר לפתח, לפרוס ולהפעיל קביעת AI בעלת ביצועים גבוהים ופעולות RAG בקנה מידה גדול”.
המהדורה הראשונה של ארכיטקטורת ההתייחסות WARRP זמינה כעת להורדה בחינם. בקרו בכתובת https://www.weka.io/resources/reference-architecture/warrp-weka-ai-rag-reference-platform/ לקבלת עותק.
משתתפי Supercomputing 2024 יכולים לבקר ב-WEKA בביתן #1931 לקבלת פרטים נוספים והדמו של הפתרון החדש.
תמיכה בהצעות מחיר לספק שירותי ענן AI
Applied Digital
“כשהחברות מנצלות יותר ויותר AI מתקדמת ו-GenAI להסיק כדי להעצים את הלקוחות והעובדים שלהן, הן מזהות את היתרונות של ניצול RAG עבור פשטות, פונקציונליות ויעילות גדולות יותר”, אמר Mike Maniscalco, מנהל הטכנולוגיה הראשי ב-Applied Digital. “ערימת WARRP של WEKA מספק מסגרת התייחסות שימושית ביותר כדי לספק צינורות RAG לפרוס ייצור בקנה מידה, נתמך על ידי טכנולוגיית NVIDIA חזקה ותשתית ענן אמינה וניתנת להגדלה”.
Ori Cloud
“חברות GenAI מובילות פועלות ב-Ori Cloud כדי להכשיר את LLM הגדולות בעולם ולהשיג ניצול GPU מקסימלי הודות לאינטגרציה שלנו עם פלטפורמת הנתונים “WEKA, אמר Mahdi Yahya, מייסד ומנכ”ל Ori Cloud. “אנו מצפים לעבוד עם WEKA כדי לבנות פתרונות חישוב חזקים באמצעות ארכיטקטורה WARRP כדי לעזור ללקוחות Ori Cloud למקסם את היתרונות של צינורות RAG כדי להאיץ את חדשנות AI שלהם”.
אודות WEKA
WEKA מעצבת גישה חדשה לערימת הנתונים הארגונית שנבנתה עבור עידן AI. פלטפורמת הנתונים של ®WEKA קובעת את הסטנדרט עבור תשתית AI עם ארכיטקטורה מקומית לענן ו-AI שניתן לפרוס בכל מקום, ומספקת ניידות נתונים חלקה על פני סביבות מקומיות, ענן וסביבות קצה. היא הופכת מצבורי נתוני מורשת לצינורות נתונים דינמיים המאיצים את GPUs, אימוני מודל AI וההשלכה, ועומסי עבודה אינטנסיביים לביצועים אחרים, ומאפשרים להם לעבוד ביעילות רבה יותר, לצרוך פחות אנרגיה ולהפחית את פליטות הפחמן הקשורות. WEKA מסייעת למאות מהמפעלים המובילים בעולם ולארגוני מחקר מובילים להתגבר על אתגרי נתונים מורכבים כדי להגיע לגילויים, תובנות ותוצאות מהר יותר – כולל 12 מ- .Fortune 50 בקרו בכתובת www.weka.io ללמוד עוד, או התחברו עם WEKA ב-X, LinkedIn ו.Facebook
WEKA והלוגו של WEKA הם סימנים מסחריים רשומים של WekaIO, Inc. שמות מסחריים אחרים המשמשים במסמך זה עשויים להיות סימנים מסחריים של בעליהם המתאימים.
2024[1] מגמות גלובליות ב- AI, ספטמבר 2024, S&P Global Market Intelligence

תמונה – https://mma.prnewswire.com/media/2561543/4304845.jpg
לוגו – https://mma.prnewswire.com/media/1796062/WEKA_v1_Logo.jpg