什么是獨熱編碼
One-Hot編碼,又稱為一位有效編碼,主要是采用N位狀態寄存器來對N個狀態進行編碼,每個狀態都由他獨立的寄存器位,并且在任意時候只有一位有效。
(資料圖片)
One-Hot編碼是分類變量作為二進制向量的表示。這首先要求將分類值映射到整數值。然后,每個整數值被表示為二進制向量,除了整數的索引之外,它都是零值,它被標記為1。
我們用如下案例來理解獨熱編碼:
性別特征:["男","女"]
祖國特征:["中國","美國,"法國"]
運動特征:["足球","籃球","羽毛球","乒乓球"]
怎么轉化成獨熱碼呢?
用獨熱碼來表示就是
男? =>? 10
女? =>? 01
祖國特征:["中國","美國,"法國"](這里N=3):
中國? =>? 100
美國? =>? 010
法國? =>? 001
運動特征:["足球","籃球","羽毛球","乒乓球"](這里N=4):
足球? =>? 1000
籃球? =>? 0100
羽毛球? =>? 0010
乒乓球? =>? 0001
所以,當一個樣本為["男","中國","乒乓球"]的時候,完整的特征數字化的結果為:
[1,0,1,0,0,0,0,0,1]
知識點
OneHotEncoder(categories='auto', sparse='True', dtype='float')
參數說明:
1、categories:默認’auto’,根據根據訓練數據自動確認類別;默認數組的列表,categories[i]保存第 i 列中預期的類別。傳遞的類別不應在單個特征中混合字符串和數值,并且應在數值的情況下進行排序。使用的類別可以在categories_屬性中找到。
2、sparse:默認為True,如果設置為 True 將返回稀疏矩陣,否則將返回一個數組。
3、dtype:默認為float,所需的輸出數據類型。
我們用sklearn的preprocessing進行數據預處理,案例如下:
關鍵詞:
把ChatGPT請進駕駛室 奔馳微軟聯手放大招
最近,著名德國汽車品牌梅賽德斯-...
共赴碳中和之約,沃爾沃汽車參展2023上海國際碳博會-今日聚焦
【2023年6月14日】首屆上海國際碳...
世界新消息丨卓易信息(688258.SH):艾普陽(深圳)在研產品DevMagic Studio系列產品...
卓易信息(688258 SH):艾普陽(深...
環球微速訊:A股異動 | 掌閱科技再度漲停 月內累計升幅達36% 首款AI產品"閱愛聊"封閉內測
格隆匯6月14日丨掌閱科技(603533,...
據日媒“Sponichi”報道,正隨日本隊備戰與..._世界時快訊
據日媒“Sponichi”報道,正隨日本...
鋸末作染料,柘木效果好|全球看熱訊
柘木為全國十大稀有珍貴名木之一,...
全球焦點!第16屆世界夏季特殊奧林匹克運動會在德國柏林開幕
每經AI快訊,第16屆世界夏季特殊奧...
環球實時:韓國衛生巾保質期_韓國衛生巾怎么處理
一、廢棄的衛生巾是不可以回收使用...