Управляемый AI-сервис · Израиль · 2026

Все модели AI.
Ваши диски.Одна подписка.

Claude, GPT, Gemini — все лучшие AI по одной подписке.
Ваши данные остаются на ваших физических дисках в Израиле.

Связаться с нами Как это устроено
Все модели AI
Ваши физические диски
Корпоративный RAG
Защита по Галахе
От ₪200/мес · Данные на ваших дисках · Полное владение
Доступные модели Claude GPT-4 Gemini Llama Mistral Qwen DeepSeek
Как это работает

Три шага к
управляемому AI

01

Ваш фундамент

Физические диски и базы данных в сертифицированном израильском ЦОД. Полное владение данными — ни один провайдер AI не имеет к ним доступа.

PostgreSQL Qdrant Redis Docker
NVMe · 3.84TB · Encrypted
NVMe · 3.84TB · Encrypted
Backup · Cold
02

Мы управляем

Настройка, индексация, RAG, маршрутизация запросов по моделям, безопасность, мониторинг — мы берём всю инфраструктуру на себя.

Cloudflare WAF Zero Trust RAG Pipeline Smart Routing
Ваш запрос
Router
Claude
GPT-4
Gemini
03

Вы получаете

Все ведущие модели через одну подписку. Хостинг открытых моделей на Nebius GPU — или API-доступ к закрытым. Одна цена, без DevOps.

Claude 4 Sonnet API · Подписка
Claude 4 SonnetAnthropic
Контекст200K
ТипClosed API
ЗадачиКод, анализ, RAG
ДоступПодписка Hezek

Флагманская модель Anthropic. Лучший выбор для юридического анализа, генерации кода и сложных цепочек рассуждений.

GPT-4.1 API · Подписка
GPT-4.1OpenAI
Контекст1M
ТипClosed API
ЗадачиУниверсальная
ДоступПодписка Hezek

Мультимодальная модель OpenAI. Отлично справляется с длинными документами, суммаризацией и мультиязычными задачами.

DeepSeek-R1-0528 Nebius · $0.80/1M input
DeepSeek-R1-0528DeepSeek · Nebius
Параметры671B MoE
Контекст128K
Input$0.80/1M
Output$2.40/1M

Reasoning-модель с chain-of-thought. Конкурент o1 по математике и логике. Хостится на Nebius — данные не покидают инфраструктуру.

DeepSeek-V3-0324 Nebius · $0.50/1M input
DeepSeek-V3-0324DeepSeek · Nebius
Параметры685B MoE
Контекст128K
Input$0.50/1M
Output$1.50/1M

Быстрая MoE-модель для генерации, чата и суммаризации. Оптимальный баланс цена/качество для большинства задач.

Qwen3-32B Nebius · $0.10/1M input
Qwen3-32BAlibaba · Nebius
Параметры32B
Контекст128K
Input$0.10/1M
Output$0.30/1M

Компактная и быстрая. Идеальна для потоковой обработки документов, классификации и рутинных задач по минимальной цене.

Llama 3.3 · 70B Nebius · $0.13/1M input
Llama 3.3 · 70BMeta · Nebius
Параметры70B
Контекст128K
Input$0.13/1M
Output$0.40/1M

Open-source флагман Meta. Отличный баланс для code generation, чата и инструкций. Полностью на вашей инфраструктуре.

Мы закупаем токены у провайдеров AI оптом по сниженным ценам и предоставляем вам доступ ко всем моделям через единую подписку. Открытые модели хостятся на Nebius GPU (от $3/час H100). Ваши данные остаются на ваших физических дисках в израильском ЦОД.


Архитектура

Простая структура
от диска до модели

Model Layer
Model Layer
Claude, GPT, Gemini, Qwen, DeepSeek — all models, one API
Control Layer
Control Layer
routing, security, RAG, audit — this is the moat
Execution Layer
Execution Layer
Nebius GPU, cloud, self-hosted — your choice
Nebius Services Architecture

Физическое владение

Ваши данные на ваших физических дисках. Ни один провайдер AI не имеет доступа к вашим документам. Клиентская тайна сохранена по умолчанию.

Корпоративный RAG

Семантический поиск по делам, контрактам и документам. AI-ассистент юриста работает с вашей базой знаний на ваших дисках.

Оптовые токены

Мы закупаем токены оптом и предоставляем вам все модели по одной подписке. Дешевле, чем покупать у каждого провайдера отдельно.

Защита по Галахе

Данные физически в Израиле. Соответствие требованиям израильского законодательства и специфическим требованиям религиозного права.


Deployment

Deploy your way —
cloud, self-hosted, or both

Cloud (Nebius)

GPU instances, managed scaling, token API.

Self-hosted

Your servers, your network, full isolation.

Hybrid

Mix cloud and on-prem based on workload.

Nebius models & GPU pricing

Qwen3-32B$0.10/1M input
DeepSeek-R1-0528$0.80/1M input
DeepSeek-V3-0324$0.50/1M input
Llama 3.3 · 70B$0.13/1M input

Token API

Pay per use

GPU Compute

Rent by hour

Self-host

Your hardware


No lock-in guarantee

Replaceable by design.
We earn your business every month.

Leave anytime

No contract lock, no exit fees.

Full data export

All data exportable at any time.

Open configs

YAML/JSON, infra-as-code, dockerized.

Multi-provider

Swap execution layers freely.

Portable vectors

Take your embeddings anywhere.


Безопасность

Мы защищаем
от периметра до запроса

Физическая безопасность ЦОД

Ваши диски в сертифицированном израильском дата-центре. Контроль доступа, видеонаблюдение, резервное питание — всё включено.

Cloudflare

Сетевая защита

WAF · Web Application Firewall
DDoS Protection · Always On
Traffic Filtering · L3–L7
Invisible Servers · Zero Exposure

Zero Trust

Мы настраиваем — вы работаете. Каждый сотрудник верифицируется по идентификатору и устройству. Нет доверия по умолчанию.

Шифрование

Данные зашифрованы at rest и in transit. Ключи шифрования только у вас. Даже мы не можем прочитать ваши документы.

Let's Encrypt

Изоляция данных

Настраиваемые уровни доступа для каждого сотрудника. Векторная база отдаёт чанки документов только после проверки прав доступа к компании и делу.

Аудит и соответствие

GDPR, Галаха — мы ведём логи. Каждое обращение к документу записывается. Полная цепочка аудита для регуляторов.

For maximum privacy, deploy self-hosted models via Nebius GPU — all inference stays on your infrastructure.

Путь запроса

Как запрос проходит
через систему безопасности

Стадия 0
Пользователь
>
wavy = WAF
Cloudflare Pre-Security Layer
DDOS SHIELD SQL INJECTION XSS BOT FILTER SCRIPT BLOCK
Cloudflare Cloudflare · Partner
dashed = proxy
Middleware Proxy Авторизация и фильтрация
RATE LIMIT FINGERPRINT IP REPUTATION SESSION VERIFY
Результат: очищенный, авторизированный запрос готов для Query Security Filter
JSON Output
Query Sec. Filter
Проверка роли клиента в компании. Переформулировка или блок подозрительных запросов.
JSON{ "clean-query": "...", "user-id": "12345", "tenant-id": "Comp-A", "user-role": "standard", "risk-score": 0.05 }
Проверки
Access & Threat Detection
Access & Threat Detection
TENANT ID USER ROLE SUBSCRIPTION PATTERN SCAN PROMPT INJECTION RISK SCORE
Embedding Zone
Стадия 3
Embedding Service
"I want to cook" → [0.05, -0.14, 0.32, ...] 768-dim float32
768-DIM FLOAT32
Возможности
Preprocessing & Embedding
Preprocessing & Embedding
768 dimensions
query → vector
Local
Qdrant Weaviate Milvus Chroma pgvector
Cloud
Pinecone Zilliz Weaviate Cloud
Vector DB
Vector DB Search
Vector DB Search
Фильтрация
Access-Filtered Results
Access-Filtered Results
TOP-K CHUNKS COSINE SIMILARITY TENANT FILTER PERMISSION LVL
Стадия 5
Chunk-Level Sanitization
PII Sanitization
050399029... [Phone]
slepppi@gmail [Email]
PII MASKING PHONE EMAIL DOCUMENT IDS
GPT
Claude
Gemini
Token Factory
Local LLM Inference
CLAUDE GPT GEMINI NEBIUS TOKEN FACTORY LOCAL LLM CUSTOM MODELS
Аудит
Query Budgeting & Audit
Query Budgeting & Audit
Контроль
Rate Limiting + Audit Trail
▸ 2026-03-18T14:32:01Z query_id=a8f3c
▸ tokens_used: 1,847 / budget: 92%
▸ rate_limit: 14/50 req/min
▸ audit_hash: sha256:e4b2...9f1a ✓
RATE LIMITING QUERY BUDGET AUDIT TRAIL GDPR
Тарифы

Простая подписка
без скрытых расходов

Choose how you pay

Token API

Pay per million tokens, all models

GPU Compute

Rent H100 by the hour

Hybrid

Subscription + on-demand compute

Platform fee is visible. We don't hide margins in token markup.

Старт
~₪750/мес
поддержка · для небольших команд
Установка: от ₪5,000 (разово)
  • Все AI-модели (Claude, GPT, Gemini)
  • Базовые физические диски
  • До 3 пользователей
  • Базовая поддержка
  • Шифрование и аудит
Infrastructure details
Старт
$500 — $1,300/mo
Cloudflare CDN Middleware Proxy App Server
Supabase PostgreSQL Qdrant Vector DB Nebius GPU
Local NVMe 2TB LLM Inference
Supabase
Сервер базы (Supabase)
$80 — $150
Qdrant
Vector DB (Qdrant)
$80 — $150
Nebius
GPU inference (Nebius)
$300 — $900
Local Disks
Физические диски (2TB)
$15 — $50
Cloudflare
Network (Cloudflare)
$20 — $60
Инфраструктура: $495 — $1,310
Вы платите только ~₪750/мес — мы покрываем всё остальное
MedOne Nebius Cloudflare
Claude 3.5API
GPT-4oAPI
Gemini ProAPI
Llama 3
Mistral
Qwen
DeepSeek

API models via token subscription. Open-source models available as add-on.

Организация
от ₪7,500/мес
поддержка · для крупных фирм
Установка: от ₪35,000 (разово)
  • Выделенная инфраструктура
  • Безлимитные пользователи
  • SLA с гарантиями
  • Персональный менеджер
  • Кастомная интеграция
Infrastructure details
Организация
$7,000 — $25,000/mo
Cloudflare Enterprise Load Balancer K8s Cluster x4-6
PostgreSQL HA + Redis Qdrant HA Cluster Nebius H100 x5-20
Enterprise RAG Full Model Fleet Audit + Compliance
NVMe 24TB RAID + DR Backup + DR
Kubernetes
Backend nodes ×4-6
$500 — $1,500
Qdrant
Vector DB cluster (Qdrant)
$500 — $2,000
Nebius
GPU ×5-20 (Nebius H100)
$4,000 — $18,000
Redis
Distributed cache (Redis)
$200 — $500
Local Disks
Физические диски (24TB RAID + backup)
$250 — $900
Bezeq
Full colocation rack
$500 — $2,000
Инфраструктура: $5,950 — $24,900
Вы платите только от ₪7,500/мес — мы покрываем всё остальное
Anan Bezeq Nebius Cloudflare Vercel
Claude 3.5API
GPT-4oAPI
Gemini ProAPI
Llama 3Open
MistralOpen
QwenNebius
DeepSeekNebius

Full model fleet — API, open-source, and Nebius models. Custom fine-tuned models supported.

Разовая установка + ежемесячная поддержка · Без DevOps с вашей стороны · все AI-модели · мониторинг 24/7
Works with Anthropic OpenAI Google PostgreSQL Qdrant Cloudflare Docker Redis

Дополнительно

Когда будете
готовы

Собственные модели

Обучение open-source моделей (Llama, Mistral) на ваших данных. Данные никогда не покидают ваши диски. Полный контроль над моделью.

GPU-время для обучения

Аренда вычислительных мощностей для fine-tuning и обучения. Масштабируется под задачу. Оплата только за реальное использование.

Умная маршрутизация

Автоматическая оценка запроса и выбор оптимальной модели. Кэширование частых запросов. Снижение затрат без потери качества.

Закрытая песочница

Изолированная среда для тестирования моделей на конфиденциальных данных. Без единого запроса наружу. Полная изоляция от внешней сети.

Обучение доступно для открытых моделей (Llama, Mistral и др.) — данные остаются на ваших дисках. Claude, GPT, Gemini — доступ через оптовые токены в рамках подписки.


Почему мы

Четыре причины
выбрать нас

Еврейское для еврейского

Мы понимаем культуру, право и язык.

Без привязки

Ваша инфраструктура портативна по дизайну.

Ваши диски — ваш контроль

Физическое владение дисками — это фундамент.

Прозрачное ценообразование

Видно, за что вы платите.

Разовая установка — постоянная поддержка

Мы разворачиваем всю инфраструктуру end-to-end и берём на себя поддержку.

Отзывы

Что говорят
наши клиенты