假设有这样一段字符串:
name:Bill
age:20
salary:9999
需要将它转化为 Python 的字典:
info = {'name': 'Bill', 'age': 20, 'salary': 9999}
当然,对每一行使用 split(':')就可以直接进行分割得到 Key 和 Value,但这并不是根本的解决办法。因为还存在以下格式的字符串:
name>Bill
age>20
salary>9999
或者
Bill==>name
20==>age
9999==>salary
或者
name,age,salary
Bill,20,9999
这些字符串让人来看,可以发现他们对应的 Python 字典是完全一样的,但是这就不能简单地通过规则匹配来转换了。
每一种格式的字符串都有一万个,所以训练集数量不是问题。希望能实现一个机器学习算法,输入一些训练集来训练这个系统,之后再输入新的字符串,就能个自动输出对应的 Python 字典。
请问这样的系统应该如何设计?