Dataset and Dataloaders in Pytorch

About 54 results

Open links in new tab

Any time

zhihu.com
https://www.zhihu.com › question
在看一些论文中经常遇到，data set 与 dataset ，那请问这二者的区别 …
dataset未出现在任何词典中。然而，在当代美国英语语料库中有172例，大部分都出现在“学术”部分，这意味着dataset是一种正式的学术写作。它之所以没有出现在词典中，可能是因为它是一种新创词语 …
zhihu.com
https://www.zhihu.com › question
Pytorch中的Dataset 和 DataLoader起什么作用？ - 知乎
经过step1和step2,已经可以获取我们需要的数据，但是仍然无法批量处理和随机选取等操作，因此需要DataLoader类进一步进行封装。综上： Dataset类用来定义自己的数据集格式 DataLoade类是一个 …
wordreference.com
https://forum.wordreference.com › threads
Dataset vs. data set - WordReference Forums
Oct 4, 2008 · For me, a dataset is a common name used to talk about data that come from the same origin (are in the same file, the same database, etc.) while a data set is a more general set of data. …
wordreference.com
https://forum.wordreference.com › threads › the-experiment-was-run-in-on-th…
The experiment was run <in / on> the whole dataset
Feb 21, 2014 · I am unsure for noun 'dataset', when should we use perp. in and when use on or in and on both are exchangable, no essential difference? For an example, we can say: 1. We run a …
zhihu.com
https://www.zhihu.com › tardis › bd › art
模仿学习 (Imitation Learning)入门指南
模仿学习的思想很直观 (intuitive)。我们在前面所介绍的Model-free, Model-based强化学习方法都是从零开始 (from scratch) 探索并学习一个使累计回报最大的策略 (policy) 。 Imitation Learning的想法是， …
zhihu.com
https://www.zhihu.com › question
PyTorch Dataset的shuffle与不shuffle：为何会产生显著差异？
当shuffle = True时，数据在每个 epoch（训练轮次）开始时会被随机打乱顺序。而shuffle = False时，数据会按照其在Dataset中的原始顺序依次被加载。产生显著差异的原因模型训练方面梯度更新的稳 …
zhihu.com
https://www.zhihu.com › question
研究生毕设做深度学习相关课题但没有数据集怎么办？ - 知乎
给你推荐两个我平时用来找数据集的网站 1. ScienceDB (scidb.cn) 这个网站的特点是全面，各个领域各个种类的数据集都有，但是缺点是对于深度学习而言，只是最初时的数据集，没有标注，但是我觉得 …
zhihu.com
https://www.zhihu.com › question
写深度学习代码是先写model还是dataset还是train呢，有个一般化的顺 …
它们都采用 model - dataset - train 的顺序进行构建，实现了单机多卡，联邦学习等训练环境：在Cifar10与Cifar100上采用各种ResNet，以Mixup作为数据增广策略，实现监督分类与无监督学习。 …
zhihu.com
https://www.zhihu.com › question
怎么训练自己的ai小模型? - 知乎
介绍大语言模型（Large Language Model, LLM）的出现引发了全世界对AI的空前关注。无论是ChatGPT、DeepSeek还是Qwen，都以其惊艳的效果令人叹为观止。然而，动辄数百亿参数的庞大 …
zhihu.com
https://www.zhihu.com › question
Dataloader如何根据Dataset中样本序列的长度由短到长取batch?
按照序列长度分组并进行批次采样BucketSampler 分桶策略（Bucketing Strategy）是一种在处理变长序列数据时常用的方法，它通过将相似长度的样本分到同一个批次中，以减少批次内的填 …

Pagination
- Next
- Next