需要定义“机器人喜欢什么”、“机器人讨厌什么”,总要有一个出发点,构成这条逻辑链的基点。
比如人讨厌虫子,逻辑可能就是基于:
人想要生存,虫子很多带毒威胁生存,自然选择使得讨厌虫子的人存活率更高。
那我说一个可能的逻辑链,机器人被设定了阿西莫夫三原则:
第一条
机器人不得伤害人类
第二条
机器人必须服从人类的命令,除非与第一条相矛盾
第三条
机器人必须保护自己,除非与第一、二条相矛盾
可能的一种实现方式,比如机器人看到人被伤害,那么它的本能设定要求它阻止此事发生,拖延时间越久扣分越多。
但是如果场景是人伤害人,机器人不能伤害施暴者,否则违反定律。
机器人又找不到阻止伤害发生的办法,于是一直扣分。
机器人最终在痛苦不堪中想明白了,只要不小心打破煤气罐就好了。