“ 没了bit,星牛力挽狂澜”
01
—
舰船再遇引力波攻击,星牛巧用bit妙招
所有进入过迷你宇宙的人都失去了那段记忆,事实上,从迷你宇宙之外来看,整个过程持续的时间并不长——迷你宇宙内外的时间尺度差的不是一个两个数量级。所以他们现在的处境就是逃离了中子星的引力,处于一个诡异的空间,就是在这里,他们刚刚经历过了那段被删掉的记忆。
bit的躯体被冷冻了起来,k30舰长决定带领大家继续前行,道阻且长,行则将至,k30再次起航,他们没有再遇到中子星,没有遇到恒星爆炸,没有遇到任何奇怪的状况,所有人都在祈祷,因为失去了bit,现在的k30巡航舰遇到此前的境况无异于送死,但是该来的还是来了… …
第一个意识到危险的还是飞船的探测器,他们遇到了大量的引力波!但又好像不是引力波,因为探测器探测到的引力波是非连续的,呈现不规则形状,根据对探测到的第一束引力波的持续追踪,引力波经过的地方都会产生一个“引力真空”区域,就好像存在大气层的星球,流体速度突然变快,导致其周围的压力突然变小一样,这个引力波经过的区域也会造成一个类似的“引力真空区域”。本处于引力平衡的区域,就会在引力差的情况下形成一个巨大的追随引力波的推力。所有未被引力波直接撞击的物体都会被甩到这个区域,无论原来在什么位置;如果遭到引力波直接撞击,物体会被拉伸扭曲,就像原本是一艘巡航舰,如果遇到强大的引力波团,那么这艘巡航舰可能会被抻成面条。
显示所有大图
所有人的目光投向了k30的舰长。
这时的舰长还在思考,是不是可以采用之前遇到的陨石雨同样的处理方案,但是很快就自己否认了这个方案。因为首先巡航舰没有任何多余舰体可以发射出去当活靶,其次,任何利用电磁信号实时探测的手段必将失效——一定会被引力波吞噬。
就在舰长和船员全体陷入沉默的时候,星牛发现了一个现象:随着引力波的推进,舰船探测到了更多的引力波,他们的破坏力的确很强,但是他们发现引力波的阵型与之前遇到的陨石雨的阵型虽然存在差异,但是引力波似乎也可以通过类似陨石的建模方式,甚至相同数量的维度进行建模。也就是说,在高度密集的引力波攻击下,如果舰船可以找出那些类似无伤害能力的陨石一样,找到攻击力弱的引力波团,舰船就可以像之前通过陨石雨一样,通过引力波团的攻击。
星牛立马提议技术人员观察一下,能否对引力波团进行建模,而建模的维度最好保持与之前对陨石的建模维度一致,当然这个问题的关键依然是需要一个活靶子,对这些引力团打好标签,起码需要知道哪种的引力波团攻击力更强,破坏力更大,哪种的引力波团是在巡航舰的承受能力范围之内。
k30舰长这时的脑海中想到了k30出发之前工程师曾经提到过一个微型的粒子对撞机,原理正是通过外部引力波激发,产生粒子碰撞,从而产生一个迷你黑洞,这个黑洞可吸收最高频率为1.0e7 hz的引力波,而目前探测到的引力波团的最高频引力波超过了1.0e13 hz。但是从目前监测情况来看,只有15%~20%的高频引力波,其他都是在迷你黑洞可以接受的范围之内(这个迷你黑洞就为标注数据提供了绝佳的机会,而不至于牺牲整艘巡航舰作为活靶子)。
k30舰长跟大家宣布了这个想法:利用唯一的k30巡航舰作为“活靶子”,这也是不得已的方案。获得大家默认之后,舰长开始安排这项工作,将舰尾的粒子对撞机调整好位置,舰尾对1.0e7 hz以下的引力波团进行拦截和标记,如果遇到强力冲击波,最坏的结果就是整个巡航舰失去了最后的杀手锏,等待大家的估计只有湮灭于这魔鬼般的茫茫宇宙之中。
慢慢地,第一束引力波团过来了,粒子对撞机成功被启动!众人松了一口气。接着第二束、第三束引力波团接踵而至,粒子对撞机的迷你黑洞成功将其接收,工程人员随即也记录下了引力波的冲击力大小。再接下来第四束、第五束… …第763束引力波团都被成功接收,粒子对撞机产生的迷你黑洞在接收若干引力波团之后对引力波团的接收频率和抗冲击能力也获得了提高。当然,中间也有个别引力波团对巡航舰造成了破坏,导致飞船的散热出现短暂故障,不过很快被修复。但是在接收第6043个引力波团的时候,粒子对撞机开始报警,主要原因是巡航舰搭载的核能即将耗尽,如果将所有核能全部耗尽,即便穿过了这个引力波团的密集攻击,那么飞船也将会失去主动加速和制动的机会,只能任由大星体捕捉或者毁灭,所以舰长建议停止粒子对撞机。粒子对撞机停下来之后技术人员开始对已经获得的的引力波团数据进行建模和分析,很快按照之前陨石雨的方案得到了一个初步的模型,但是效果不甚理想,准确率只有63%,导致巡航舰的侧翼受损严重。
眼看下一轮引力波团就要到来,巡航舰上的船员陷入了犹豫:这样下去与慢性自杀无异。k30舰长也陷入了两难的境地,一时间也不知道如何是好。
此时的星牛反倒没有说话,自己躲在角落好像在思考着什么。星牛确实想到了什么。因为bit“生前”曾经跟他提到过一个方案,就是在遇到陨石雨的时候,就是如果我们能够侥幸通过陨石雨,但是损失惨重的话,可以通过一个增强方案以备下次使用。于是星牛把这个方案分享给了大家。
简单来说,我们利用现在掌握的数据很难获得一个精准的模型以准确判断引力波团的冲击力到底有多大,但是我们起码有个基础的模型,准确率可以达到60%以上,如果我们有多个类似的基础模型,每个基础模型能够在不同的数据判断上有所侧重,然后将多个模型“融合”在一块,作为整体的模型,利用整合之后的模型继续学习数据的深层次信息,或许能够获得一个更好的效果提升。而多个效果不甚理想的基础模型是通过反复学习得到的,即第一轮我们可以获得一个基础模型,他能够在60%多的数据上表现出良好的判断准确性,剩下30%多容易误判;接下来改变数据的权值分布或者概率分布,从而使得当前这个基础模型误分类的样本(30%多分类错误的样本)权重获得提升,正确分类的样本权重下降,从而在训练下一轮效果比较差的基础模型的时候,可以让模型更加关注误分类的样本(具体就是提升误分类的数据样本的权重,对应的也提升了模型需要优化的误差或者损失,然后通过优化函数使得模型可以在这些被上一轮模型误分类的数据上重点学习从而判断更准确),然后随着学习轮次的增加,所有的误分类的样本都会如此通过概率分布的调整被不断训练的新的基础模型所解决,最终,整合之后的模型对所有数据误分类的情况普遍下降,理想情况下甚至可以达到消除误分类。
最终,大家齐心协力成功将巡航舰驶过引力波团。然而他们不知道的是,等待他们的可能比毁灭还要痛苦… …
02
—
掉书袋
【1】 上述情节中将多个基础模型组合在一块形成集成模型是对adaboost算法思想的一个简单介绍。
【2】 adaboost是boosting算法的一个例子,也叫提升算法,最早是以多项式算法的形式被提出。
【3】算法中会根据基础模型在当前权重分布的样本上的表现,比如哪些分类错误,错误率是多少等决定下一轮数据的权重,这样在不改变数据的情况下通过权重调整了数据分布,从而可以调整模型学习的方向。
【4】adaboost如何将弱分类器集成为强分类器呢?思路很简单,通过加权多数表决的方式,具体来说,减小分类误差率大的弱分类器的权值,使其在分类中起较小的作用;同时加大分类误差率小的弱分类器的权值,使其在分类中起较大的作用。
03
—
参考文献
1. 关键字:《统计学习方法》、李航
2. 关键字:《机器学习》、西瓜书、周志华
3. 关键字:coursera、adaboost
01
—
舰船再遇引力波攻击,星牛巧用bit妙招
所有进入过迷你宇宙的人都失去了那段记忆,事实上,从迷你宇宙之外来看,整个过程持续的时间并不长——迷你宇宙内外的时间尺度差的不是一个两个数量级。所以他们现在的处境就是逃离了中子星的引力,处于一个诡异的空间,就是在这里,他们刚刚经历过了那段被删掉的记忆。
bit的躯体被冷冻了起来,k30舰长决定带领大家继续前行,道阻且长,行则将至,k30再次起航,他们没有再遇到中子星,没有遇到恒星爆炸,没有遇到任何奇怪的状况,所有人都在祈祷,因为失去了bit,现在的k30巡航舰遇到此前的境况无异于送死,但是该来的还是来了… …
第一个意识到危险的还是飞船的探测器,他们遇到了大量的引力波!但又好像不是引力波,因为探测器探测到的引力波是非连续的,呈现不规则形状,根据对探测到的第一束引力波的持续追踪,引力波经过的地方都会产生一个“引力真空”区域,就好像存在大气层的星球,流体速度突然变快,导致其周围的压力突然变小一样,这个引力波经过的区域也会造成一个类似的“引力真空区域”。本处于引力平衡的区域,就会在引力差的情况下形成一个巨大的追随引力波的推力。所有未被引力波直接撞击的物体都会被甩到这个区域,无论原来在什么位置;如果遭到引力波直接撞击,物体会被拉伸扭曲,就像原本是一艘巡航舰,如果遇到强大的引力波团,那么这艘巡航舰可能会被抻成面条。
显示所有大图
所有人的目光投向了k30的舰长。
这时的舰长还在思考,是不是可以采用之前遇到的陨石雨同样的处理方案,但是很快就自己否认了这个方案。因为首先巡航舰没有任何多余舰体可以发射出去当活靶,其次,任何利用电磁信号实时探测的手段必将失效——一定会被引力波吞噬。
就在舰长和船员全体陷入沉默的时候,星牛发现了一个现象:随着引力波的推进,舰船探测到了更多的引力波,他们的破坏力的确很强,但是他们发现引力波的阵型与之前遇到的陨石雨的阵型虽然存在差异,但是引力波似乎也可以通过类似陨石的建模方式,甚至相同数量的维度进行建模。也就是说,在高度密集的引力波攻击下,如果舰船可以找出那些类似无伤害能力的陨石一样,找到攻击力弱的引力波团,舰船就可以像之前通过陨石雨一样,通过引力波团的攻击。
星牛立马提议技术人员观察一下,能否对引力波团进行建模,而建模的维度最好保持与之前对陨石的建模维度一致,当然这个问题的关键依然是需要一个活靶子,对这些引力团打好标签,起码需要知道哪种的引力波团攻击力更强,破坏力更大,哪种的引力波团是在巡航舰的承受能力范围之内。
k30舰长这时的脑海中想到了k30出发之前工程师曾经提到过一个微型的粒子对撞机,原理正是通过外部引力波激发,产生粒子碰撞,从而产生一个迷你黑洞,这个黑洞可吸收最高频率为1.0e7 hz的引力波,而目前探测到的引力波团的最高频引力波超过了1.0e13 hz。但是从目前监测情况来看,只有15%~20%的高频引力波,其他都是在迷你黑洞可以接受的范围之内(这个迷你黑洞就为标注数据提供了绝佳的机会,而不至于牺牲整艘巡航舰作为活靶子)。
k30舰长跟大家宣布了这个想法:利用唯一的k30巡航舰作为“活靶子”,这也是不得已的方案。获得大家默认之后,舰长开始安排这项工作,将舰尾的粒子对撞机调整好位置,舰尾对1.0e7 hz以下的引力波团进行拦截和标记,如果遇到强力冲击波,最坏的结果就是整个巡航舰失去了最后的杀手锏,等待大家的估计只有湮灭于这魔鬼般的茫茫宇宙之中。
慢慢地,第一束引力波团过来了,粒子对撞机成功被启动!众人松了一口气。接着第二束、第三束引力波团接踵而至,粒子对撞机的迷你黑洞成功将其接收,工程人员随即也记录下了引力波的冲击力大小。再接下来第四束、第五束… …第763束引力波团都被成功接收,粒子对撞机产生的迷你黑洞在接收若干引力波团之后对引力波团的接收频率和抗冲击能力也获得了提高。当然,中间也有个别引力波团对巡航舰造成了破坏,导致飞船的散热出现短暂故障,不过很快被修复。但是在接收第6043个引力波团的时候,粒子对撞机开始报警,主要原因是巡航舰搭载的核能即将耗尽,如果将所有核能全部耗尽,即便穿过了这个引力波团的密集攻击,那么飞船也将会失去主动加速和制动的机会,只能任由大星体捕捉或者毁灭,所以舰长建议停止粒子对撞机。粒子对撞机停下来之后技术人员开始对已经获得的的引力波团数据进行建模和分析,很快按照之前陨石雨的方案得到了一个初步的模型,但是效果不甚理想,准确率只有63%,导致巡航舰的侧翼受损严重。
眼看下一轮引力波团就要到来,巡航舰上的船员陷入了犹豫:这样下去与慢性自杀无异。k30舰长也陷入了两难的境地,一时间也不知道如何是好。
此时的星牛反倒没有说话,自己躲在角落好像在思考着什么。星牛确实想到了什么。因为bit“生前”曾经跟他提到过一个方案,就是在遇到陨石雨的时候,就是如果我们能够侥幸通过陨石雨,但是损失惨重的话,可以通过一个增强方案以备下次使用。于是星牛把这个方案分享给了大家。
简单来说,我们利用现在掌握的数据很难获得一个精准的模型以准确判断引力波团的冲击力到底有多大,但是我们起码有个基础的模型,准确率可以达到60%以上,如果我们有多个类似的基础模型,每个基础模型能够在不同的数据判断上有所侧重,然后将多个模型“融合”在一块,作为整体的模型,利用整合之后的模型继续学习数据的深层次信息,或许能够获得一个更好的效果提升。而多个效果不甚理想的基础模型是通过反复学习得到的,即第一轮我们可以获得一个基础模型,他能够在60%多的数据上表现出良好的判断准确性,剩下30%多容易误判;接下来改变数据的权值分布或者概率分布,从而使得当前这个基础模型误分类的样本(30%多分类错误的样本)权重获得提升,正确分类的样本权重下降,从而在训练下一轮效果比较差的基础模型的时候,可以让模型更加关注误分类的样本(具体就是提升误分类的数据样本的权重,对应的也提升了模型需要优化的误差或者损失,然后通过优化函数使得模型可以在这些被上一轮模型误分类的数据上重点学习从而判断更准确),然后随着学习轮次的增加,所有的误分类的样本都会如此通过概率分布的调整被不断训练的新的基础模型所解决,最终,整合之后的模型对所有数据误分类的情况普遍下降,理想情况下甚至可以达到消除误分类。
最终,大家齐心协力成功将巡航舰驶过引力波团。然而他们不知道的是,等待他们的可能比毁灭还要痛苦… …
02
—
掉书袋
【1】 上述情节中将多个基础模型组合在一块形成集成模型是对adaboost算法思想的一个简单介绍。
【2】 adaboost是boosting算法的一个例子,也叫提升算法,最早是以多项式算法的形式被提出。
【3】算法中会根据基础模型在当前权重分布的样本上的表现,比如哪些分类错误,错误率是多少等决定下一轮数据的权重,这样在不改变数据的情况下通过权重调整了数据分布,从而可以调整模型学习的方向。
【4】adaboost如何将弱分类器集成为强分类器呢?思路很简单,通过加权多数表决的方式,具体来说,减小分类误差率大的弱分类器的权值,使其在分类中起较小的作用;同时加大分类误差率小的弱分类器的权值,使其在分类中起较大的作用。
03
—
参考文献
1. 关键字:《统计学习方法》、李航
2. 关键字:《机器学习》、西瓜书、周志华
3. 关键字:coursera、adaboost