إطلاق منصة LiteLLM Agent: ثورة في إدارة وكلاء الذكاء الاصطناعي

منصة LiteLLM Agent الجديدة تقدم حلاً متكاملاً لتشغيل وكلاء الذكاء الاصطناعي في بيئات الإنتاج.

المقدمة: التحدي في نشر وكلاء الذكاء الاصطناعي

في عالم الذكاء الاصطناعي سريع التطور، أصبح تشغيل وكلاء الذكاء الاصطناعي كبرامج نصية محلية أمرًا بسيطًا ومباشرًا. ومع ذلك، فإن نشر هؤلاء الوكلاء بشكل موثوق في بيئات الإنتاج، عبر فرق متعددة، ومع ضمان الاستمرارية حتى في حالة إعادة التشغيل، وتوفير بيئات معزولة لكل سياق، يمثل تحديًا مختلفًا تمامًا وأكثر تعقيدًا. إن إدارة الحالة، وسجلات الجلسات، ونتائج استدعاء الأدوات، والتفكير الوسيط الذي يحمله الوكلاء عبر أدوار مختلفة، يتطلب بنية تحتية قوية ومصممة خصيصًا.

Meet LiteLLM Agent Platform: A Kubernetes-Based, Self-Hosted Infrastructure Layer for Isolated Agent Sandboxes and Persistent Session Management in Production

لمواجهة هذه المشكلة المحورية، أعلنت شركة BerriAI، المطورة لبوابة LiteLLM AI Gateway الشهيرة، عن إطلاق منصة LiteLLM Agent Platform كحل مفتوح المصدر. تُوصف المنصة بأنها طبقة بنية تحتية بسيطة وذاتية الاستضافة، مصممة خصيصًا لتشغيل عدد كبير من وكلاء الذكاء الاصطناعي في بيئات الإنتاج بكفاءة وموثوقية عالية. هذا الإطلاق يمثل خطوة هامة نحو سد الفجوة بين تطوير وكلاء الذكاء الاصطناعي الفرديين ونشرهم على نطاق واسع في التطبيقات الحقيقية.

المشكلة التي تحلها منصة LiteLLM Agent

يساعد فهم تعقيدات توسيع نطاق وكلاء الذكاء الاصطناعي إلى ما يتجاوز عملية واحدة على تقدير قيمة هذه المنصة. يتميز وكلاء الذكاء الاصطناعي بأنهم يحافظون على حالتهم (stateful)، مما يعني أنهم يحتفظون بسجل الجلسة، ونتائج استدعاء الأدوات، والتفكير الوسيط عبر التفاعلات المختلفة. إذا تعطل الحاوية التي تشغل الوكيل أو أُعيد تشغيلها أو استُبدلت أثناء عملية نشر، فإن حالة الجلسة هذه تُفقد ما لم يكن هناك نظام يديرها صراحةً.

في الوقت نفسه، غالبًا ما تحتاج الفرق المختلفة داخل المؤسسة إلى بيئات تشغيل متباينة، وأدوات مختلفة، وبيانات سرية متنوعة، ونطاقات وصول محددة. هذا التنوع يعني أنه لا يمكن ببساطة وضع جميع الوكلاء في حاوية مشتركة واحدة دون المخاطرة بالتعارضات الأمنية أو التشغيلية. هنا تبرز أهمية منصة LiteLLM Agent، حيث تعالج هذه التحديات بشكل أساسي.

تقوم المنصة بإدارة جانبين أساسيين: أولاً، توفير بيئات معزولة (sandboxes) لكل فريق ولكل سياق، مما يضمن أن كل وكيل يعمل في بيئته الخاصة دون التأثير على الآخرين. ثانيًا، تضمن المنصة استمرارية الجلسة عبر عمليات إعادة تشغيل وحدات pods وعمليات الترقية. هاتان القدرتان هما الركيزتان الأساسيتان للبنية التحتية التي توفرها المنصة، مما يضمن الموثوقية والأمان في بيئات الإنتاج.

البنية والركيزة التقنية

تتميز منصة LiteLLM Agent ببنية تحتية قوية ومرنة. فهي تقدم لوحة تحكم مستقلة مبنية على Next.js لوكلاء LiteLLM v2 المُدارين، وتغطي إدارة الجلسات، وعمليات إنشاء/تعديل/حذف الوكلاء (CRUD)، ومراقبة الحالة الحية. يعتمد الكود المصدري بشكل أساسي على TypeScript (بنسبة 92.8%)، مع استخدام نصوص Shell للتهيئة، وDockerfile لإنشاء الحاويات، وCSS لواجهة المستخدم للوحة التحكم.

تفصل البنية بين الاهتمامات بوضوح: تعمل عملية الويب على المنفذ 3000 لتقديم لوحة تحكم Next.js، بينما تتولى عملية عامل (worker) معالجة مهام الوكيل غير المتزامنة. يُستخدم Postgres كمتجر بيانات دائم، ويتم تشغيل ترحيل المخطط (schema migration) كحاوية تهيئة (init container) عند بدء التشغيل، مما يضمن أن قاعدة البيانات تكون دائمًا في حالتها الصحيحة قبل بدء تشغيل التطبيق.

بالنسبة لطبقة sandbox – وهي بيئة التشغيل المعزولة حيث تُنفذ الوكلاء فعليًا – يتم تشغيل الـ sandboxes على Kubernetes عبر تعريف المورد المخصص (CRD) kubernetes-sigs/agent-sandbox . للتطوير المحلي، تُستخدم kind (Kubernetes in Docker) لإنشاء مجموعة Kubernetes كاملة محليًا باستخدام حاويات Docker كعقد، دون الحاجة إلى موفر سحابي. يقوم CRD الخاص بالـ agent-sandbox بتعليم مجموعة Kubernetes كيفية إدارة دورة حياة بيئات الـ sandbox الفردية كـ resources من الدرجة الأولى.

تتضمن المنصة أيضًا نظام harness تحت harnesses/opencode ، والذي يحتوي على تكوين لتشغيل وكلاء البرمجة (مثل Claude Code أو OpenAI Codex) داخل بيئات sandbox معزولة باستخدام وكيل vault proxy لإدارة بيانات الاعتماد. يحتفظ فريق BerriAI أيضًا بمستودع litellm-agent-runtime منفصل، يُوصف بأنه بيئة تشغيل لوكلاء البرمجة تعمل داخل أجهزة افتراضية (VMs) لكل جلسة يتم توفيرها بواسطة وكيل LiteLLM، وهو تصميم عام مع إمكانية التخصيص عبر تكوين الـ harness أو حمولة hydrate .

أحد التفاصيل العملية الجديرة بالملاحظة هو كيفية التعامل مع متغيرات البيئة عبر حاويات الـ sandbox . أي شيء في ملف .env مسبوق بـ CONTAINER_ENV_ يُحقن في كل حاوية sandbox مع إزالة البادئة. على سبيل المثال، CONTAINER_ENV_GITHUB_TOKEN=ghp_... يعني أن الحاوية ترى GITHUB_TOKEN=ghp_... . يمنح هذا الفرق طريقة نظيفة لتمرير البيانات السرية إلى جلسات الوكيل المعزولة دون تعديل صور الحاويات.

العلاقة ببوابة LiteLLM AI Gateway

من المهم التأكيد على أن منصة LiteLLM Agent هي طبقة إضافية فوق نظام LiteLLM البيئي الحالي، وليست بديلًا عنه. تكمن نواة LiteLLM في حزمة تطوير برمجيات (SDK) وخدمة وكيل (Proxy Server) تعتمد على Python - وهي بوابة للذكاء الاصطناعي - يمكنها استدعاء أكثر من 100 واجهة برمجة تطبيقات لنموذج لغوي كبير (LLM API) بتنسيق OpenAI الموحد. توفر هذه البوابة ميزات حيوية مثل تتبع التكلفة، وخطوط الحماية (guardrails)، وموازنة التحميل، والتسجيل، وتدعم مجموعة واسعة من المزودين بما في ذلك Bedrock، وAzure، وOpenAI، وVertexAI، وCohere، وAnthropic، وSageMaker، وHuggingFace، وvLLM، وNVIDIA NIM.

تعتمد منصة Agent على بوابة LiteLLM العاملة كأحد تبعياتها، وتقوم ببناء البنية التحتية لتنسيق الوكلاء وإدارة الجلسات فوقها. وعليه، فإن مهام توجيه النماذج، وتتبع التكلفة، وتحديد معدل الاستخدام تظل ضمن طبقة البوابة. بينما تُعالج مهام عزل الـ sandboxes ، واستمرارية الجلسة، ولوحة التحكم الإدارية بواسطة منصة Agent.

المكونات الأساسية للنظام

بوابة LiteLLM AI Gateway: هي البوابة الأساسية التي تعتمد عليها منصة Agent. توجّه الطلبات إلى أكثر من 100 مزود LLM باستخدام واجهة برمجة تطبيقات موحدة بتنسيق OpenAI. يجب أن تكون عاملة بشكل منفصل.
Sandbox (الصندوق الرملي): بيئة حاوية معزولة حيث تُنفذ جلسة وكيل واحدة. كل sandbox مستقل، مما يعني أن الوكيل لا يمكنه الوصول إلى نظام الملفات أو البيانات السرية أو حالة وكيل آخر. تُنشأ وتُزال sandboxes لكل جلسة باستخدام kubernetes-sigs/agent-sandbox CRD .
Harness: طبقة تكوين تحدد كيفية تشغيل نوع معين من وكلاء البرمجة (مثل Claude Code أو OpenAI Codex) داخل sandbox . تأتي المنصة مزودة بـ opencode harness .
CRD (Custom Resource Definition): امتداد Kubernetes يتيح لك تحديد أنواع موارد جديدة. تستخدم المنصة agent-sandbox CRD لإدارة الـ sandboxes كموارد أساسية في Kubernetes.

متطلبات التطوير المحلي والبدء السريع

للبدء بالتطوير المحلي، لا تتطلب منصة LiteLLM Agent Platform أي بيانات اعتماد سحابية. المتطلبات الأساسية هي:

Docker Desktop: مطلوب لبناء وتشغيل الحاويات وتشغيل kind .
kind (Kubernetes in Docker): يُستخدم لتوفير مجموعة Kubernetes محلية لتشغيل الـ sandboxes .
kubectl: أداة سطر الأوامر لـ Kubernetes، تُستخدم للتفاعل مع مجموعة kind .
helm: مدير حزم Kubernetes، يُستخدم لتثبيت وحدة التحكم agent-sandbox .
بوابة LiteLLM عاملة: تتطلب المنصة عنوان URL لبوابة LiteLLM لتوجيه استدعاءات النموذج.

تتم عملية البدء السريع عبر أمرين بسيطين:

bin/kind-up.sh: يقوم بتهيئة مجموعة kind وتثبيت وحدة التحكم agent-sandbox وتحميل صورة الـ harness .
docker compose up: يبدأ تشغيل Postgres، ويقوم بترحيل المخطط، ويبدأ عملية الويب (على المنفذ 3000) وعملية العامل.

بعد ذلك، يمكن الوصول إلى لوحة التحكم عبر http://localhost:3000 لمراقبة الوكلاء والجلسات.

النشر في بيئات الإنتاج

بالنسبة للنشر في بيئات الإنتاج، المسار الموصى به هو استخدام AWS EKS لمجموعة الـ sandbox و Render لعمليات الويب والعامل. يتوفر برنامج نصي bin/eks-up.sh لتهيئة مجموعة EKS، وتوفر Render Blueprint خيار نشر بنقرة واحدة.

ماذا يعني هذا لك؟

بالنسبة للمطورين، ومهندسي DevOps، والفرق التي تعمل على تطوير ونشر حلول الذكاء الاصطناعي، تمثل منصة LiteLLM Agent Platform قفزة نوعية. فهي تزيل العديد من التعقيدات المرتبطة بتشغيل وكلاء الذكاء الاصطناعي على نطاق واسع في بيئات الإنتاج. تعني القدرة على استضافة الوكلاء ذاتيًا في بيئات معزولة مع استمرارية الجلسة، أن الشركات يمكنها بناء تطبيقات ذكاء اصطناعي أكثر موثوقية وأمانًا ومرونة.

سواء كنت تدير وكلاء برمجة يحتاجون إلى وصول آمن للموارد، أو وكلاء محادثة يتطلبون الاحتفاظ بسجل المحادثات، فإن هذه المنصة توفر الأدوات اللازمة لتحقيق ذلك بكفاءة. هذا يقلل من الوقت المستغرق في إعداد البنية التحتية، ويسمح للفرق بالتركيز بشكل أكبر على تطوير منطق الوكيل الأساسي، مما يسرع من دورات التطوير والنشر ويخفض التكاليف التشغيلية على المدى الطويل.

الخاتمة

تمثل منصة LiteLLM Agent Platform حلاً مبتكرًا ومفتوح المصدر للتحديات المعقدة المرتبطة بنشر وكلاء الذكاء الاصطناعي في بيئات الإنتاج. بفضل قدراتها على توفير بيئات sandbox معزولة لكل فريق ولكل سياق، وضمان استمرارية الجلسة عبر عمليات إعادة التشغيل، تُقدم المنصة مستوى جديدًا من الموثوقية والأمان وقابلية التوسع.

بالاعتماد على بوابة LiteLLM AI Gateway، لا تكتمل المنصة فحسب، بل تُعزز من قدرة الشركات على الاستفادة الكاملة من نماذج اللغة الكبيرة ووكلاء الذكاء الاصطناعي في تطبيقاتهم الحية. تُظهر هذه الخطوة من BerriAI التزامًا بدعم مجتمع الذكاء الاصطناعي من خلال توفير أدوات بنية تحتية قوية ومرنة، مما يفتح آفاقًا جديدة لتطبيقات الذكاء الاصطناعي المبتكرة والمستقرة.

تتوفر المنصة حاليًا كإصدار تجريبي عام (alpha public preview) تحت ترخيص MIT، مما يشجع على المشاركة المجتمعية والتطوير المستمر.

المراجع

LiteLLM Agent Platform GitHub Repository

المراجع:
LiteLLM Agent Platform

Badr Ai