データの集合体。分析・処理・研究などの目的で収集・整理された、関連するデータの一まとまりを指す。主にコンピュータサイエンスや統計学の分野で使われる。
/ˈdeɪtəˌsɛt/
The dataset contains information about thousands of customers.
そのデータセットには、何千人もの顧客に関する情報が含まれている。
Researchers carefully cleaned and preprocessed the dataset before training their machine learning model to ensure accurate results.
研究者たちは正確な結果を得るために、機械学習モデルの訓練前にデータセットを丁寧にクリーニングし、前処理を行った。
data(ラテン語の datum「与えられたもの」の複数形)と set(古英語の settan「置く、配置する」に由来)を組み合わせた複合語。20世紀半ばにコンピュータ科学の発展とともに広まった用語で、初期のコンピュータ処理において、関連するデータをひとまとめにして扱う概念を表すために生まれた。