想让机器学习与商业结合,最重要的是什么?(12)
\n \n
归一化:若存在不同等级的特征 , 系数相关的算法就会产生偏见 。 比方说 , 特征年龄在[0100
范围内用年表示 , 然而工资在[0 , 100 , 000
范围内用美元表示 。 优化算法可能仅仅因为工资的绝对数量级更大而更侧重工资 。 因此 , 更推荐常态化算法以及其他常用方法 , 如Z值推测、标准化(如果数据正常)及min-max特征归一化 。
分箱:将实值栏映射到不同类别极为有效 , 如将一个回归问题转化为分类问题 。 比方说 , 你想推测航班进港延误的分钟数 。 一个选择是推测该航班是否会提前、准时抵达或延误 , 并确定各类别的数值范围 。
\n \n\n
特征工程无处不在
\n \n\n \n
总而言之 , 特征就是机器学习算法需要学习的特点 。 正如人们设想的那样 , 干扰或无关数据会影响模型的质量 , 因此掌握好的特征就十分关键 。 以下是几个特征工程中可使用的策略:
\n \n确定预测内容 。 每一个实例代表什么?顾客?交易?病人?还是票据?确保特征集的每一行都对应一个实例 。
推荐阅读
- Uzi|Knight或像UZI因商业合同被卡俱乐部,LOL官方对此都毫无办法
- 战争机器5|战争机器5,有改变也需要让玩家射击的爽快
- 超级机器人大战30|明日方舟:白嫖材料活动更新,玩家收益减少,鹰角策划又不当人?
- 国服|LOLM:60天内如何从小白打到国服王者?这快捷径方法值得学习
- 催眠学习|《催眠学习》PC版,一款教你如何恋爱的游戏,非绅骑步呦!
- 任天堂|免费“大作”会有吗?任天堂商业报告提到将改善Switch会员服务
- 虎牙|哈利波特手游:同流派该如何击败?虎牙小若沐展示细节,值得学习
- 梦幻西游|梦幻西游:一只须弥画魂的励志蜕变史,这才是值得学习人生态度!
- 超级机器人大战30|不怕被LCK网友喷!Ray发文力挺:希望EDG可以夺冠!祝他们有好运
- 超级机器人大战30|猫神重新跟AG一队训练,瓜主剧透:AG若打不赢狼队,最初首发不保