Першасная апрацоўка даных — этап падрыхтоўкі даных, у ходзе якога трансфармуецца іх фармат і структура, што можа прывесці да змены схемы даных[1]. Праводзіцца перад аналізам даных каб павысіць іх надзейнасць і паўнату, зрабіць прыдатнымі для ўжывання[2].
Прыклады
Прыклады аперацый, якія могуць выконвацца ў працэсе першаснай апрацоўкі даных[1]:
- Змена парадку слупкоў у табліца.
- Стварэнне новых атрыбутаў на аснове ўжо прысутных.
- Аб’яднанне атрыбутаў.
- Выдаленне (фільтрацыя) непатрэбных запісаў.
- Змена гранулярнасці набору даных праз агрэгацыю і звядзенне.
- Запаўненне пропускаў у даных (напрыклад нулямі, сярэднім, медыянай) або выдаленне запісаў з пропускамі.
Крыніцы
- 1 2 Three Levels of ML Software (англ.). ML Ops: Machine Learning Operations. Праверана 13 снежня 2023.
- ↑ What Is Data Wrangling? Definition, Steps, and Why It Matters (англ.). Coursera. Праверана 14 снежня 2023.
This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.