فن آوران گیتی افروز
مدل‌های زبانی بومی سازمانیهوش مصنوعی مولد و LLM سازمانی

LLM فارسی‌محور برای سازمان شما — از Pre-training تا Production، روی زیرساخت خودتان

خانواده‌ای از مدل‌های زبانی بومی (مبتنی بر روبیک، سیمرغ و پارسی) با پشتیبانی Context تا ۱۲۸K، Function Calling، Vision و قابلیت Fine-tuning روی داده اختصاصی — قابل استقرار به‌صورت SaaS، VPC اختصاصی یا On-Prem کاملاً Air-Gapped.

بنچمارک ParsiNLU: ۸۲.۴Persian MMLU: ۷۴.۱+۳۰ سازمان در فاز Pilot
هوش مصنوعی مولد و LLM سازمانی
LLM
احراز هویت
Authentication
  • Single Sign-On
  • Passkeys & FIDO2
  • Adaptive MFA
  • Biometric
حاکمیت دسترسی
Authorization
  • RBAC / ABAC
  • PAM
  • Zero Trust
  • Just-in-Time
چرخه عمر
Lifecycle
  • Provisioning
  • Deprovisioning
  • Audit Trail
  • Compliance
یکپارچگی
Integration
  • SAML 2.0
  • OIDC / OAuth
  • SCIM 2.0
  • REST API

اعتماد سازمان‌هایی که نمی‌خواهند داده‌شان از کشور خارج شود

۴ بانک در فاز Pilot۳ بیمه با RAG اختصاصی۲ سازمان درمانی۶ هلدینگ صنعتی با Copilot داخلی
+۱۲ میلیاردتوکن پردازش‌شده روزانه روی زیرساخت ما
مسیر ارزش‌آفرینی

ما نه فقط دردهای شما را می‌فهمیم — برای رسیدن به آنچه که سازمان شما باید باشد، نقشه می‌سازیم.

GITA LLM یک خانواده مدل زبانی بومی است که از پایه برای زبان فارسی Pre-train شده و با مراحل SFT و RLHF/DPO روی داده انسانی فارسی تنظیم شده است. تیم ML ما در فاز Discovery، ترکیب مناسب از مدل پایه، RAG، Fine-tuning و Guardrails را برای کسب‌وکار شما طراحی می‌کند — از Chatbot بانکی تا Copilot صنعتی.

Before

وضعیت رایج امروز

  1. 01

    کیفیت پاسخ فارسی مدل‌های جهانی برای حوزه تخصصی پایین است

    هزینه پنهان: نیاز به Post-processing، Hallucination بالا، اعتماد پایین کاربر

  2. 02

    ارسال داده مشتری به API خارجی ممنوع یا پرریسک است

    هزینه پنهان: نقض الزامات بانک مرکزی، رد شدن در ممیزی، ریسک نشت داده

  3. 03

    Fine-tune مدل اختصاصی روی داده محرمانه ممکن نیست

    هزینه پنهان: مدل عمومی می‌ماند، مزیت رقابتی از دست می‌رود

  4. 04

    latency پاسخ‌گویی و هزینه توکن غیرقابل پیش‌بینی است

    هزینه پنهان: تجربه کاربری ضعیف، بودجه IT غیرقابل کنترل

After

با LLM

  1. 01

    اجرای کامل روی زیرساخت داخل سازمان

    قبلاً: ارسال داده محرمانه به API خارجی

  2. 02

    مدل Fine-tune شده روی داده دامنه شما

    قبلاً: کیفیت متوسط در فارسی تخصصی

  3. 03

    Context تا ۱۲۸K برای اسناد کامل

    قبلاً: Context ۸K و قطع‌شدن مکالمات بلند

  4. 04

    RAG با Embedding فارسی و Citation

    قبلاً: Hallucination روی اسناد داخلی

معماری راهکار

معماری GITA LLM چگونه کار می‌کند — جریان داده زنده

هسته معماری، خانواده‌ای از Foundation Modelهای بومی است که با Tokenizer اختصاصی فارسی، Pre-training روی ۱.۲ تریلیون توکن فارسی و چندزبانه، و سپس SFT و RLHF/DPO روی داده انسانی آموزش دیده‌اند. لایه Serving با vLLM و TensorRT-LLM بهینه شده و روی H100/A100 اجرا می‌شود. RAG Pipeline، Guardrails و Observability به‌صورت Plug-in در کنار مدل قرار می‌گیرند. سه گزینه استقرار — Multi-tenant SaaS، Single-tenant VPC و On-Prem Air-Gapped — با همان API یکپارچه ارائه می‌شوند.

جریان داده
ورودی‌ها
Clients & Identities
L01
End Users
Web · Mobile
Employees
SSO Portal
Service Accounts
mTLS · API
هسته احراز
Gateway · Auth · Policy · Token
L02
Identity Gateway
Edge · TLS 1.3
Auth Engine
SSO · MFA · FIDO2
Policy Engine
RBAC · ABAC · ZTNA
Token Service
JWT · OAuth · OIDC
لایه داده
Identity Store · HSM · Directory
L03
Identity Store
PostgreSQL
HSM
PKCS#11
Directory Sync
AD / Workday
ممیزی و تله‌متری
Audit Pipeline · Kafka
L04
Audit Pipeline
Kafka stream
اپلیکیشن‌ها
Apps & Cloud
L05
Apps & Cloud
ERP · Email · Custom
درخواست احراز هویت
ارزیابی سیاست
صدور توکن
گزارش ممیزی
همگام‌سازی داده

روی برچسب‌های بالا کلیک کنید تا فقط یک نوع جریان داده فعال شود — یا روی هر نود حرکت کنید برای نمایش پررنگ‌تر.

قابلیت‌های محصول

قابلیت‌هایی که GITA LLM را برای سازمان ایرانی متمایز می‌کنند

10 ماژول تخصصی یکپارچه و قابل توسعه — برای انتخاب هر قابلیت، روی آن کلیک کنید.

هسته اصلی

خانواده مدل‌های GITA-7B، GITA-34B و GITA-MoE با Pre-training بومی روی ۱.۲T توکن.

مدل‌های ما از پایه با Tokenizer اختصاصی فارسی (نسبت فشرده‌سازی ۱.۸ برابر بهتر از GPT-4 برای فارسی) Pre-train شده‌اند. سپس مراحل SFT روی ۲ میلیون نمونه دستورالعمل فارسی و RLHF/DPO روی بازخورد انسانی بومی اعمال شده است. نتیجه: کیفیت پاسخ فارسی نزدیک به GPT-4 با هزینه و latency بسیار کمتر.

نکات کلیدی
  • Tokenizer اختصاصی فارسی، عربی و انگلیسی
  • Pre-training روی ۱.۲T توکن فارسی + کد
  • SFT روی ۲M نمونه دستورالعمل بومی
  • RLHF/DPO با بازخورد انسانی فارسی‌زبان
برای شمابنچمارک ParsiNLU: ۸۲.۴ — بالاتر از Llama-3-70B
موارد استفاده صنعتی

راهکار LLM متناسب با صنعت شما

بانک — Chatbot و دستیار شعبه

Chatbot فارسی برای پاسخ به مشتری، دستیار کارمند شعبه برای جستجوی بخشنامه‌ها، و خلاصه‌سازی صورت‌حساب — همه با PII Redaction و Audit کامل.

بیمه — Claim Processing

استخراج اطلاعات از فرم خسارت، تطبیق با شرایط بیمه‌نامه، تشخیص تقلب اولیه و تولید پیش‌نویس پاسخ — کاهش زمان رسیدگی تا ۶۰٪.

درمان — Triage و خلاصه پرونده

Triage اولیه بیمار، خلاصه‌سازی پرونده الکترونیک سلامت، کمک به پزشک در کدگذاری ICD-10 — با رعایت کامل محرمانگی روی زیرساخت بیمارستان.

خرده‌فروشی — Conversational Commerce

مشاور خرید فارسی روی کاتالوگ محصول، پاسخ به سؤالات سفارش، پیشنهاد متناسب و پشتیبانی بازگشت کالا در WhatsApp و تلگرام.

دولتی — پاسخ‌گویی به شهروند

دستیار شهروندی برای راهنمایی خدمات دولتی، استعلام مدارک، و پر کردن فرم — استقرار کامل Air-Gapped روی شبکه دولت.

حقوقی — Legal-tech

جستجوی معنایی در آرای قضایی، خلاصه‌سازی قرارداد، تشخیص ریسک بندها و تولید پیش‌نویس لایحه — با Citation به ماده قانون.

دانشگاهی و آموزش

دستیار پژوهشی برای جستجو در مقالات فارسی، تولید سؤال آزمون، و Tutor شخصی برای دانشجو — همراه با Eval علمی.

تولیدی — Copilot عملیات

Copilot برای اپراتور خط تولید، جستجو در دستورالعمل‌های نگهداری، تحلیل لاگ خطا و پیشنهاد اقدام اصلاحی — با Vision روی تصویر تجهیز.

یکپارچه‌سازی

GITA LLM با اکوسیستم شما کار می‌کند

+۴۰ ادغام آماده با ابزارهای LLM و سازمانی
فریم‌ورک‌های LLM
  • LangChain
  • LlamaIndex
  • Haystack
  • Semantic Kernel
  • DSPy
Vector Databases
  • pgvector
  • Qdrant
  • Milvus
  • Weaviate
  • Elasticsearch
SDK و زبان‌ها
  • OpenAI SDK (سازگار)
  • Python
  • Node.js
  • Go
  • .NET
Observability
  • OpenTelemetry
  • Datadog
  • Grafana
  • Langfuse
  • Arize
Orchestration و MLOps
  • Kubernetes
  • Ray Serve
  • vLLM
  • TensorRT-LLM
  • MLflow
کانال‌های ارتباطی
  • WhatsApp Business
  • تلگرام
  • Microsoft Teams
  • Web Widget
  • IVR
ادغام اختصاصی با سامانه داخلی خود را درخواست دهید
فرآیند پیاده‌سازی

از Playground تا Production در ۴ فاز

نقشه راه شفاف از اولین تماس تا عملیات دائمی — هر مرحله با خروجی قابل اندازه‌گیری.

PHASE 01۱ هفته

ارزیابی Use-case و داده

جلسه با تیم ML ما، بررسی Use-caseها، ارزیابی داده موجود و انتخاب ترکیب مناسب مدل + RAG + Fine-tuning.

سند LLM Architecture Blueprint
PHASE 02۳–۵ هفته

Pilot روی SaaS یا VPC

پیاده‌سازی Pilot روی ۱ تا ۲ Use-case، ساخت RAG اولیه، Eval روی داده شما و آموزش تیم.

Pilot عملیاتی با متریک کیفیت
PHASE 03۴–۸ هفته

Fine-tuning و On-Prem

آموزش مدل اختصاصی روی داده سازمان، استقرار On-Prem روی کلاستر GPU، فعال‌سازی Guardrails و Observability.

مدل اختصاصی در Production
PHASE 04دائمی

بهبود مستمر و Eval

Retraining دوره‌ای، A/B Testing نسخه‌ها، پایش drift و بهینه‌سازی هزینه/کیفیت بر اساس داده عملیاتی.

SLA کیفیت و در دسترس بودن
سوالات متداول فنی

سوالاتی که تیم فنی شما احتمالاً می‌پرسد

کیفیت مدل فارسی شما در بنچمارک‌ها چقدر است؟+

GITA-34B در ParsiNLU به امتیاز ۸۲.۴، در Persian MMLU به ۷۴.۱ و در HumanEval-Fa به ۶۸.۲ رسیده است — بالاتر از Llama-3-70B و نزدیک به GPT-4 در وظایف فارسی. گزارش کامل بنچمارک با متد ارزیابی شفاف در Whitepaper موجود است و قابلیت اجرای Eval روی داده شما نیز فراهم است.

آیا می‌توانیم مدل را با داده اختصاصی خود Fine-tune کنیم؟+

بله، Fine-tuning Self-Service از LoRA، QLoRA، Full SFT و DPO پشتیبانی می‌کند. در استقرار VPC یا On-Prem، داده هیچ‌گاه از مرز سازمان شما خارج نمی‌شود. معمولاً برای دیتاست ۵۰ تا ۲۰۰ هزار نمونه، آموزش در ۲ تا ۵ روز روی ۴ تا ۸ کارت H100 کامل می‌شود.

امنیت داده ما چگونه تضمین می‌شود؟ آیا داده‌ها را می‌بینید؟+

در حالت On-Prem و VPC، ما به‌صورت اصولی به داده دسترسی نداریم — مدل و RAG روی زیرساخت شما اجرا می‌شوند. در حالت SaaS، داده درخواست و پاسخ به‌صورت پیش‌فرض برای آموزش استفاده نمی‌شود (Opt-out پیش‌فرض)، در ایران ذخیره می‌شود و قابلیت حذف کامل لاگ پس از ۳۰ روز فعال است.

latency پاسخ‌گویی چقدر است؟+

روی GITA-7B با vLLM و A100، Time-to-first-token کمتر از ۲۰۰ میلی‌ثانیه و throughput تا ۸۰ توکن در ثانیه per-stream است. روی GITA-34B با H100، TTFT حدود ۳۵۰ms و ۴۵ tok/s. در حالت Batch، throughput کلی تا ۳۰۰۰ توکن در ثانیه per-GPU می‌رسد.

حداقل سخت‌افزار برای استقرار On-Prem چیست؟+

برای GITA-7B: حداقل ۲× A100 ۴۰GB یا L40S. برای GITA-34B: ۴× A100 ۸۰GB یا ۲× H100. برای حالت Production با HA، توصیه ما ۸× H100 با NVLink است. کارت‌های هواوی Ascend و سامسونگ نیز در روادمپ قرار دارند.

کیفیت RAG روی اسناد سازمانی ما چطور خواهد بود؟+

RAG Studio با Embedding فارسی-v3، Hybrid Search (BM25 + Dense) و Re-ranker اختصاصی به طور معمول دقت top-5 retrieval را به ۸۹–۹۴٪ روی اسناد سازمانی فارسی می‌رساند. کیفیت دقیق پس از ساخت Eval Set اختصاصی شما در فاز Pilot گزارش می‌شود.

Hallucination مدل را چگونه کنترل می‌کنید؟+

ترکیب چند لایه: RAG با Citation اجباری به منبع، Output filter که پاسخ‌های بدون Grounding را Refuse می‌کند، Self-consistency check، و Eval خودکار با داور LLM. در پایلوت‌های بانکی، نرخ Hallucination از ۱۸٪ مدل خام به کمتر از ۴٪ رسیده است.

آیا با Qpilot و سایر محصولات GITA یکپارچه می‌شود؟+

بله، GITA LLM به‌عنوان لایه هوش زبانی پایه برای Qpilot، GITA Identity (Adaptive MFA با تحلیل رفتاری متن) و GITA SIEM (تحلیل لاگ با LLM) عمل می‌کند. API یکپارچه و SSO سازمانی به طور پیش‌فرض میان محصولات فعال است.

انطباق با الزامات بانک مرکزی و افتا چه وضعی دارد؟+

استقرار On-Prem Air-Gapped کاملاً پشتیبانی می‌شود و مستندات انطباق با ابلاغیه‌های افتا و الزامات بانک مرکزی برای فناوری‌های نوظهور ارائه می‌گردد. PII فارسی، Audit Log غیرقابل تغییر و Data Residency داخل کشور به طور پیش‌فرض فعال هستند.

مدل قیمت‌گذاری چگونه است؟+

سه مدل: SaaS به ازای میلیون توکن (ورودی/خروجی به تفکیک، قیمت ریالی شفاف)، VPC اختصاصی با هزینه ماهانه ثابت و Quota توکن، و On-Prem با License سالانه و پشتیبانی. برای پایلوت، ۵ میلیون توکن رایگان به همراه ۲ جلسه فنی با تیم ML ارائه می‌شود.

تماس مستقیم با تیم فنی

Playground را امتحان کنید یا با تیم ML ما صحبت کنید

۳۰ دقیقه با Lead ML ما صحبت کنید. Use-case شما را بررسی می‌کنیم، دموی زنده روی داده نمونه شما می‌زنیم و نقشه راه Pilot را پیشنهاد می‌دهیم. رایگان، بدون پرزنتیشن فروش.

تلفن مستقیم
+۹۸ ۲۱ ۱۲۳۴ ۵۶۷۸
ایمیل تخصصی
llm@gitiafrooz.com
ساعات کاری
شنبه تا چهارشنبه — ۹ تا ۱۸
فرم درخواست جلسه
مرحله ۱ از ۲

۳۰ ثانیه طول می‌کشد

معمار ارشد ما طی ۴ ساعت کاری با شما تماس می‌گیرد.

رایگان · بدون پرزنتیشن فروش · بدون تعهد