Статья посвящена современному направлению развития информационных технологий – параллельным вычислениям с использованием программно-аппаратной архитектуры CUDA. В работе описана возможность потоковых вычислений на графических процессорах. Приведена модель параллельного программирования на низкоуровневой платформе CUDA. Акцентируется внимание на различиях в организации потоков, обработке данных и доступа к памяти на CPU и GPU. Как показывает проведенный анализ, эффективное программирование массивно-параллельных процессоров требует детального понимания принципов параллельного программирования, а также моделей параллелизма, обмена данными и знания различных архитектурных ограничений этих процессоров. В статье доказывается, что прирост производительности от использования технологии CUDA определяется возможностью распараллеливания кода. Рассмотрен многопоточный обмен информации между центральным и графическим процессором и произведён анализ его эффективности при различных аспектах обработки данных. Перечислены инновационные, технологические особенности современной процессорной архитектуры NVIDIA Kepler.