先给出代码的git地址: https://github.com/thu-ml/RoboticsDiffusionTransformer[https://github.com/...

先给出代码的git地址: https://github.com/thu-ml/RoboticsDiffusionTransformer[https://github.com/...
四、数据处理模块 该模块需要看两处代码分为别hdf5_vla_dataset.py[https://github.com/thu-ml/RoboticsDiffusionTr...
前言 大约有三年的时间没有更新过简书的文章了, 最近随着人型机器人比较火热并伴随着大模型的成熟, 具身智能技术也被业界关注着, 当然我也转向投入具身智能算法. 这段时间我也...
该文章是openAI一系列文本图像生成工作的最新一篇,)下面给出这篇文章及代码的链接:paper[https://arxiv.org/pdf/2204.06125v1.pdf...
这篇文章发自OpenAI, 首先给出该文的地址以及对应的代码:Blog[https://openai.com/blog/clip/] paper[https://arxiv....
接着上次对比学习[https://www.jianshu.com/p/70b037d2b431]的内容,这次主要说下基于掩码的对比学习。 1 MAE paper[https:...
这段时间浏览了大量的自监督学习方面的知识,今天就通过本篇博客将这些有关方面的知识进行汇总。本文将从SimCLR,MoCo, BYOL等多个模型为切入点做一个自监督学习的总结,...
本文转自同事别吃了, ST-GCN 基于骨架动作识别的时空图卷积网络[https://www.jianshu.com/p/be85114006e3]这篇文章写的很棒动作识别在...
神经网络在过去的十年里取得了巨大的成功,然而早期的神经网络变体只能使用规则结构的数据或欧几里得数据(Euclidean data)来实现,而现实世界中的大量数据具有底层的非欧...
写的很棒
图卷积网络 Graph Convolutional Network(GCN) 理解神经网络在过去的十年里取得了巨大的成功,然而早期的神经网络变体只能使用规则结构的数据或欧几里得数据(Euclidean data)来实现,而现实世界中的大量数据具有底层的非欧...
神经网络在过去的十年里取得了巨大的成功,然而早期的神经网络变体只能使用规则结构的数据或欧几里得数据(Euclidean data)来实现,而现实世界中的大量数据具有底层的非欧...
该篇文章是在一年前所看的,也是何凯明参与的一篇文章,今天正好在视频分类的文章中做下总结。code:SlowFast[https://github.com/facebookre...
接着上一篇文章TSM视频理解[https://www.jianshu.com/p/22317230210d], 今天介绍新的视频分类网络TIN(Temporal Interl...
前段时间研究了一波关于视频分类的相关代码,这里准备写一系列博客介绍一下有关于视频分类的相关论文及代码。这篇博客主要介绍下Temporal Shift Module for E...
牛人会为了提升模型效果加上各种花里胡哨的操作来提升一点点准确率,而神人为不断简化模型,通过很简单的模型来提升模型的效果,何凯明的这篇文章基于transformer的基础上进行...
一、 DeepWalk 说白了就是生成随机在初始点进行随机游走得到一波序列,然后将这波序列输入到word2vec得到向量表示。 二、 LINE 低度效果不一定好 三、 No...