ulna's blog
  • Startseite
  • Archiv
  • Kategorien
  • Schlagwörter
  • Über
  • Weblinks

Datawhale AI夏令营 大模型微调 task3 笔记

数据增强调用大模型在本次任务中,我们通过星火Max模型对于训练材料进行增强,主要是对于每道阅读题补足4道单选题并给出答案,扩充训练数据。在注册好星火大模型后我们先安装调用大模型的sdk。 12# 环境安装pip install --upgrade spark_ai_python 安装完成后,这里给出调用星火大模型的代码,实际使用时只需填入自己的参数调用函数即可。 1234567891011121
2024-08-16
#Datawhale

AIGC baseline1 学习

baseline 分析首先总体分析baseline代码,这段代码可以分为以下几个部分: 1. 安装依赖:使用pip命令安装所需的Python库,如simple-aesthetics-predictor、data-juicer、pandas等,并卸载旧版本的pytorch-lightning。 2. 数据加载与预处理:从MsDataset加载数据集,保存图像并创建带有元数据的JSONL文
2024-08-14
#Datawhale

大模型微调 baseline1 学习

原文链接 数据提取部分input数据提取input部分由阅读材料以及相关要求 组成,我们拟通过正则表达式来匹配文字,通过pandas来处理xlsx文件 我们将,提取的数据存取为json格式,其中每条数据拥有两个字段input与output。input由 prompt + 阅读文本 组成output由 选项+ 答案 组成 语文题目 抽取数据,加载excel中的数据 12345678import p
2024-08-14
#Datawhale

c++ set

set基本用法C++ 标准库中的 <set> 是一个关联容器,它存储了一组唯一的元素,并按照一定的顺序(从小到大)进行排序。在使用前,需要引头文件 #include <set> 声明set容器: 1std::set<元素类型> 元素名; 常用操作: 1234567std::set `<int>` myset;myset.insert(1);
2024-08-06
#c++

c++ 模板

函数模板1234template <typename type> ret-type func-name(parameter list){ // 函数的主体} 以数组求和的函数为例,一般我们在对整型数组求和时,以下为一个常见的求和函数: 123456789int sum (int *begin, int*end){ int ans = 0;
2024-08-05
#c++

c++ 结构体

C++ 中的struct不在需要使用typedef,使用时可以直接使用结构体名字而无需在前面加struct,并且c++中的结构体除了可以拥有变量(成员变量)之外还可以拥有函数(成员函数) 123456789101112131415161718192021struct Point { int x,y; Point(int x = 1,int y = 0):x(x),y(y)&#
2024-08-04
#c++

CCF 202109-2!

70分超时做法 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455#include<iostream>#include <vector>#include <algorithm>#include <cmath
2024-07-31
#CCF

CCF 202112-2!

序列查询新解主要思想分析直接遍历N虽然简单但一定会超时。尝试以遍历n,在每两个n之间,f(i)相等。我们把区间左端点记为lf,右端点记为rg,在两个n之间,可能有三种情况。 g(lf) >= fi; //在此区间中g(i)全部大于fi g(rg) <= fi; //在此区间中g(i)全部小于fi 在此区间中g(i)在 i &
2024-07-30
#CCF

CCF 202206-2 寻宝!大冒险!

暴力模拟,只能70分: 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455#include<iostream>#include <vector>#include <algorithm>#include <c
2024-07-28
#CCF

CCF 202209-2 背包问题

背包问题(Knapsack problem)是一种组合优化的NP完全问题。问题可以描述为:给定一组物品,每种物品都有自己的重量和价格,在限定的总重量内,我们如何选择,才能使得物品的总价格最高。问题的名称来源于如何选择最合适的物品放置于给定背包中。相似问题经常出现在商业、组合数学,计算复杂性理论、密码学和应用数学等领域中。也可以将背包问题描述为决定性问题,即在总重量不超过W的前提下,总价值是否能达到
2024-07-27
#CCF
1…910111213

Suchen

Hexo Fluid