River библиотека для машинного обучения потоковой передачи данных
Машинное обучение часто выполняется в пакетном режиме, когда модель адаптируется к набору данных за один раз. В результате получается статическая модель, которую необходимо переобучать, чтобы учиться на новых данных. Во многих случаях это не изящно и неэффективно
В River другой подход, который заключается в постоянном изучении потока данных. Это означает, что модель обрабатывает одно наблюдение за раз и поэтому может обновляться на лету.
Это позволяет учиться на огромных наборах данных, которые не помещаются в основную память или даже обучать машину онлайн.
Он эффективен во многих случаях использования, таких как прогнозирование временных рядов, фильтрация спама, системы рекомендаций, прогнозирование CTR и приложения IoT.