2024

2024-08-25

MoDS

[TOC] MoDS: Model-oriented Data Selection for Instruction TuningPaper: https://arxiv.org/abs/2311.15653 核心思想作者提出了一种针对模型做数据选择的框架，从质量、覆盖范围、必要性三个角度评估指令微调数据对于 LLM 指令微调的增益。质量：指令本身的质量和相应回复/反馈的质量覆盖范围：数据集内

0

论文阅读数据合成及过滤

2024-08-25

强化学习基础

强化学习入门（一）学习资料整理强化学习基础学习李宏毅老师强化学习课程 Reinforce Learning Book 2020 强化学习论文学习 GAE论文（优势函数估计） InstructGPT论文强化学习实践学习 Trlx代码仓库 PlayGround 其他相关文章（简单介绍） https://spinningup.openai.com/en/latest/spinningu

0

LLMTransformer

2024-08-25

从零开始复现Transformer

从零开始复现TransformerTransformer结构介绍

2021

0

论文阅读Prompt Learning

2021-12-10

PromptBERT: Improving BERT Sentence Embeddings with Prompt

PromptBERT: Improving BERT Sentence Embeddings with PromptAbstract本文认为，原始BERT模型在句子语义相似度任务上表现不佳的原因：静态token嵌入偏差 (static token embeddings biases) 无效的BERT层 (ineffective BERT layers) 而不是因为BERT生成的句子表示的余弦

0

笔记Pytorch

2021-05-07

PyTorch-SGD-求函数最优值

面试遇到的一个基础问题：使用PyTorch求一个函数的最优值代码如下： import torch.optim as optim import torch # 参数为x，(1,1) x = torch.randn([1],requires_grad=True) def function(x): return x**2 - 2*x + 1 optimizer = optim.SGD([x

2020

0

2020-12-29

About Me

About Me 学习经历学习阶段学校专业研究方向研究生北京邮电大学计算机技术自然语言处理本科北京信息科技大学计算机科学与技术自然语言处理工作经历科大讯飞，初级算法研究工程师（2023.07 - 至今）实习经历滴滴 - 用户画像（2021.05 - 2021.08）度小满 - AI Lab（2021.09 - 2022.07）澜舟科技

子在川上曰：逝者如斯夫！不舍昼夜

主页

MoDS

强化学习基础

从零开始复现Transformer

PromptBERT: Improving BERT Sentence Embeddings with Prompt

PyTorch-SGD-求函数最优值

About Me