欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 科技 > IT业 > pytorch实现文本摘要

pytorch实现文本摘要

2025/2/7 4:51:52 来源:https://blog.csdn.net/weixin_36104843/article/details/145409999  浏览:    关键词:pytorch实现文本摘要

  人工智能例子汇总:AI常见的算法和例子-CSDN博客 

import numpy as npfrom modelscope.hub.snapshot_download import snapshot_download
from transformers import BertTokenizer, BertModel
import torch# 下载模型到本地目录
model_dir = snapshot_download('tiansz/bert-base-chinese', cache_dir='./bert-base-chinese')
print(f"模型已下载到: {model_dir}")# 本地模型路径
model_path = model_dir  # 使用下载的模型路径# 从本地加载分词器和模型
tokenizer = BertTokenizer.from_pretrained(model_path)
model = BertModel.from_pretrained(model_path)def get_sentence_embeddings(text):"""获取输入文本的句子级别嵌入(BERT模型的输出)用于摘要任务"""inputs = tokenizer(text, return_tensors="pt", truncation=True, padding=True)with torch.no_grad():outputs = model(**inputs)# 获取最后一层的[CLS] token的嵌入向量作为句子的表示return outputs.pooler_output.detach().numpy()def summarize(text, num_sentences=3):"""使用抽取式摘要从输入文本中提取最重要的句子"""sentences = text.split("。")  # 以句号分割句子sentence_embeddings = []for sentence in sentences:embedding = get_sentence_embeddings(sentence)sentence_embeddings.append(embedding)# 使用句子得分来排序sentence_scores = np.array([embedding[0][0] for embedding in sentence_embeddings])ranked_sentences = [sentences[i] for i in sentence_scores.argsort()[-num_sentences:][::-1]]# 返回排名靠前的句子return "。".join(ranked_sentences)# 示例中文文本
text = """
机器学习(Machine Learning,简称 ML)是人工智能(AI)领域的一个分支,重点研究开发能够使计算机在没有明确编程指令的情况下进行任务的算法和统计模型。机器学习通过从数据中学习,识别模式,并根据少量人为干预做出决策。 
近年来,深度学习(Deep Learning)作为机器学习的一个子集,取得了显著的进展,尤其是在计算机视觉、自然语言处理和语音识别等领域。 
深度学习技术使用多层神经网络结构,能够通过处理大量的数据来自动提取特征,从而提高机器学习的性能。 
目前,人工智能已经在多个行业中得到广泛应用,包括医疗健康、金融、自动驾驶等领域。
"""# 获取摘要
summary = summarize(text)
print("原文:\n", text)
print("\n摘要:\n", summary)

~困了🥱,通宵写了一个晚上

结果:

Downloading Model to directory: ./bert-base-chinese/tiansz/bert-base-chinese
模型已下载到: ./bert-base-chinese/tiansz/bert-base-chinese
Asking to truncate to max_length but no maximum length is provided and the model has no predefined maximum length. Default to no truncation.
原文:机器学习(Machine Learning,简称 ML)是人工智能(AI)领域的一个分支,重点研究开发能够使计算机在没有明确编程指令的情况下进行任务的算法和统计模型。机器学习通过从数据中学习,识别模式,并根据少量人为干预做出决策。 
近年来,深度学习(Deep Learning)作为机器学习的一个子集,取得了显著的进展,尤其是在计算机视觉、自然语言处理和语音识别等领域。 
深度学习技术使用多层神经网络结构,能够通过处理大量的数据来自动提取特征,从而提高机器学习的性能。 
目前,人工智能已经在多个行业中得到广泛应用,包括医疗健康、金融、自动驾驶等领域。摘要:目前,人工智能已经在多个行业中得到广泛应用,包括医疗健康、金融、自动驾驶等领域。机器学习通过从数据中学习,识别模式,并根据少量人为干预做出决策。 
深度学习技术使用多层神经网络结构,能够通过处理大量的数据来自动提取特征,从而提高机器学习的性能

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com