<label id="bh7tp"><big id="bh7tp"></big></label>

<em id="bh7tp"><tr id="bh7tp"><u id="bh7tp"></u></tr></em>
<th id="bh7tp"></th>

<li id="bh7tp"><acronym id="bh7tp"></acronym></li>
  • <em id="bh7tp"></em>

    <tbody id="bh7tp"><pre id="bh7tp"></pre></tbody>
  • Python教程自學網歡迎您來學習!
    當前位置: 首頁 > Python基礎教程 > python數據離散化是什么

    python數據離散化是什么

       

    python數據離散化是什么

    python數據離散化概念

    1、連續屬性的離散化就是將連續屬性的值域上,將值域劃分為若干個離散的區間,最后用不同的符號或整數 值代表落在每個子區間的屬性值。

    2、實現、分組,將分組好的結果轉換成one-hot編碼(啞變量)

    python數據離散化實例

    #?1)準備數據
    data?=?pd.Series([165,174,160,180,159,163,192,184],?index=['No1:165',?'No2:174','No3:160',?'No4:180',?'No5:159',?'No6:163',?'No7:192',?'No8:184'])
    #?2)分組
    #?自動分組
    sr?=?pd.qcut(data,?3)
    sr.value_counts()??#?看每一組有幾個數據
    #?3)轉換成one-hot編碼
    pd.get_dummies(sr,?prefix="height")
    ?
    #?自定義分組
    bins?=?[150,?165,?180,?195]
    sr?=?pd.cut(data,?bins)
    #?get_dummies
    pd.get_dummies(sr,?prefix="身高")
    人人爽人人澡人人人妻
    <label id="bh7tp"><big id="bh7tp"></big></label>

    <em id="bh7tp"><tr id="bh7tp"><u id="bh7tp"></u></tr></em>
    <th id="bh7tp"></th>

    <li id="bh7tp"><acronym id="bh7tp"></acronym></li>
  • <em id="bh7tp"></em>

    <tbody id="bh7tp"><pre id="bh7tp"></pre></tbody>