实现一个自然语言处理(NLP)流程,用于从专利文本中提取主语-动作-宾语(SAO)结构。使用Stanford CoreNLP进行句法分析,使用NLTK进行文本处理。
使用方法
测试单个句子
from patent_sao_extraction import test_sao_extraction
# Stanford CoreNLP的路径
corenlp_path = r'D:\python\stanford-corenlp-4.5.9'
# 使用示例句子进行测试
test_sentence = "The device has an intelligent card for storing a secret key"
test_results = test_sao_extraction(test_sentence, corenlp_path)
处理专利CSV文件
from patent_sao_extraction import process_patents
# Stanford CoreNLP的路径
corenlp_path = r'D:\python\stanford-corenlp-4.5.9'
# 处理CSV中的专利
results_df = process_patents('patents.csv', corenlp_path)