我目前正在为我的论文设置数据库,但我的工作方式不够高效。我有两个数据文件需要手动链接,但这太耗时了。
我有一个包含Session ID
和的电子表格Visit Time
(其中包含网站用户的点击数据),以及另一个包含的电子表格choice set
(其中包含访问者可能做出的选择,整个价格列表)。
Session ID sheet Session ID Visit time shopname click 1234 01-01-2012 08:30 Best Buy 1 1234 01-01-2012 08:30 Amazon 1 1235 01-01-2012 08:31 Best Buy 1 1236 01-01-2012 08:32 Best Buy 1 1236 01-01-2012 08:32 Craiglist 1
以上数据是从网站上抓取的。
Choice set sheet Position Shopname Price 1 Best Buy €100 2 Amazon €101 3 Craiglist €102 4 Random €105
以上数据是从分析客户端提取的。
现在我想要采用以下格式:
The dataset Session ID Visit time Click Position Shopname Price 1234 01-01-2012 08:30 1 1 Best Buy €100 1234 01-01-2012 08:30 1 2 Amazon €101 1234 01-01-2012 08:30 0 3 Craiglist €102 1234 01-01-2012 08:30 0 4 Random €105 1235 01-01-2012 08:31 1 1 Best Buy €100 1235 01-01-2012 08:31 0 2 Amazon €101 1235 01-01-2012 08:31 0 3 Craiglist €102 1235 01-01-2012 08:31 0 4 Random €105 1236 ..... ... ...
因此,基本上,每个唯一会话 ID 都需要有一个单独的选择集。我尝试使用,VLOOKUP
但我找不到一种方法来“插入”带有每个唯一会话 ID 的选择集列表,而不会弄乱它,因为商店名称可以有多个会话 ID。
目前我都是手动操作(复制粘贴每个会话 ID 和访问时间,并复制每个 ID 的每个选择集),但这太耗时了。有没有更快的方法来做到这一点?
亲切的问候,