twtech-Paddle-综艺节目精彩片段预测,ActivityNet基于视频的行为分类/行为检索方向项目
liuyuqi 998498dce6 add twtech-Tensorflow | 6 years ago | |
---|---|---|
.gitignore | 6 years ago | |
LICENSE | 6 years ago | |
README.md | 6 years ago | |
twtech-Paddle-综艺节目精彩片段预测.ipynb | 6 years ago | |
twtech-Tensorflow-综艺节目精彩片段预测.ipynb | 6 years ago |
twtech-Paddle-综艺节目精彩片段预测
百度提供了1470个来自爱奇艺的电视综艺视频的数据,总共约1200个小时。
视频每秒都抽取了一帧图像提取图片特征,因此视频已都被转换为了视频帧的图片特征序列,但也都提供了观看链接。
其中每个视频都被仔细地标注了“精彩片段”的时间戳,单位为秒,总共标记出了18000段、约750小时的“精彩片段”。
BROAD数据集的格式为pkl(pickle), 读取的方式总结如下:
数据集的路径请移步参赛指南中查看。
# 方法一:传统Python方法
import cPickle
with open(BROAD_filepath/xxxx.pkl,'rb') as f:
tmp1 = cPickle.load(f)
print tmp1
# 方法二:利用Pandas读取
import pandas as pd
tmp2 = pd.read_pickle(BROAD_filepath/xxxx.pkl)
tmp2
# 方法三:利用Numpy读取
import numpy as np
tmp3 = np.load(BROAD_filepath/xxxx.pkl)
tmp3