Першасная апрацоўка даных — этап падрыхтоўкі даных, у ходзе якога трансфармуецца іх фармат і структура, што можа прывесці да змены схемы даных[1]. Праводзіцца перад аналізам даных каб павысіць іх надзейнасць і паўнату, зрабіць прыдатнымі для ўжывання[2].

Прыклады

Прыклады аперацый, якія могуць выконвацца ў працэсе першаснай апрацоўкі даных[1]:

  • Змена парадку слупкоў у табліца.
  • Стварэнне новых атрыбутаў на аснове ўжо прысутных.
  • Аб’яднанне атрыбутаў.
  • Выдаленне (фільтрацыя) непатрэбных запісаў.
  • Змена гранулярнасці набору даных праз агрэгацыю і звядзенне.
  • Запаўненне пропускаў у даных (напрыклад нулямі, сярэднім, медыянай) або выдаленне запісаў з пропускамі.

Крыніцы

  1. 1 2 Three Levels of ML Software (англ.). ML Ops: Machine Learning Operations. Праверана 13 снежня 2023.
  2. What Is Data Wrangling? Definition, Steps, and Why It Matters (англ.). Coursera. Праверана 14 снежня 2023.
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.