OhMyCalc

Калькулятор задержки инференса

Оцените задержку инференса ML-моделей, анализируя вычислительную и ограниченную памятью компоненты.

Как пользоваться калькулятором задержки инференса

  1. Введите размер модели в миллионах параметров.
  2. Задайте размер батча и длину последовательности.
  3. Укажите TFLOPS GPU и пропускную способность памяти.
  4. Нажмите «Рассчитать» для анализа задержки.

Примеры использования

Формула

Задержка = max(Вычисления, Память); Вычисления = 2·Параметры·Батч·Послед / TFLOPS

Часто задаваемые вопросы

Насколько точен калькулятор?
Результаты основаны на стандартных отраслевых формулах и подходят для предварительных расчётов.
Какие единицы используются?
Стандартные IT-единицы (запросы/сек, мс, %, USD), если не указано иное.
Бесплатно?
Да, все калькуляторы полностью бесплатны.