深度学习
两个函数(把pytorch当作工具箱)
- dir():了解工具箱和工具箱的分隔区有什么。
- help():了解工具的使用方法。
1 | import torch |
数据
- Dataset:提供一种方式去获取数据及其label,以及告诉我们有多少数据
- DataLoader:为网络提供不同数据形式
1 | from torch.utils.data import Dataset |
TensorBoard
1 | from torch.utils.tensorboard import SummaryWriter |
启动:
Transformer初体验
- 核心组件:编码器-译码器、位置编码、多头注意力机制、前馈网络
- Self-Attention:
查询向量q、键向量k、值向量v、每个字符对应一个向量a
计算Attention-Score
得到输出
可以发现未知的参数只有W。
- **pipeline()**:
feature-extraction
(获得文本的向量化表示)fill-mask
(填充被遮盖的词、片段)ner
(命名实体识别)question-answering
(自动问答)sentiment-analysis
(情感分析)summarization
(自动摘要)text-generation
(文本生成)translation
(机器翻译)zero-shot-classification
(零训练样本分类)