如何使用类似 wget 的工具从 public.me.com 复制其他人的文件夹？

Question 1

该服务器显然正在运行部分或损坏的 WebDAV 实现。请注意，您需要连接到类似以下的 URLhttps://public.me.com/ix/rudchenko，不是普通的URLhttps://public.me.com/rudchenko。我尝试了几个客户端：

使用普通的 HTTP 下载器（例如 wget 或 curl），我可以下载知道其名称的文件（例如wget https://public.me.com/ix/rudchenko/directory/filename），但无法获取目录列表。
熔断器DAV，这本来是我的第一选择，无法应对一些丢失的命令。它显然设法列出根目录（在输出中可见fusedav -D），但最终运行一些返回“PROPFIND failed: 404 Not Found”的请求并锁定。
钕缺少列表命令。
尸体效果很好，但缺少递归检索命令。您可以使用它来获取列表，然后如上所述检索单个文件。

它并不完美，在这种情况下特别存在一个问题：尸体的mget 无法处理带有通配符的 args，这些通配符扩展为带有空格的文件名。
达夫文件系统2效果很好。我可以挂载该共享并从中复制文件。唯一的缺点是这不是 FUSE 文件系统，您需要 root 才能挂载它或/etc/fstab.

基于FUSE的数据文件系统-1.4.2-替代0.M51.1在这种情况下工作得很好，不需要root（仅需要权限/dev/fuse）。

mkdir viewRemote
wdfs https://public.me.com/ix/rudchenko/ viewRemote
rsync -a viewRemote/SEM*TO\ PRINT* ./
fusermount -u viewRemote
rmdir viewRemote

（当然，在本示例中，使用简单的cp替代方案rsync效果很好；rsync选择它只是为了在更新副本时对差异进行额外诊断。）

（除了 wdfs 之外，我在 Debian squeeze 系统上尝试了这些命令。您的情况可能会有所不同。）

Answer

该服务器显然正在运行部分或损坏的 WebDAV 实现。请注意，您需要连接到类似以下的 URLhttps://public.me.com/ix/rudchenko，不是普通的URLhttps://public.me.com/rudchenko。我尝试了几个客户端：

使用普通的 HTTP 下载器（例如 wget 或 curl），我可以下载知道其名称的文件（例如wget https://public.me.com/ix/rudchenko/directory/filename），但无法获取目录列表。
熔断器DAV，这本来是我的第一选择，无法应对一些丢失的命令。它显然设法列出根目录（在输出中可见fusedav -D），但最终运行一些返回“PROPFIND failed: 404 Not Found”的请求并锁定。
钕缺少列表命令。
尸体效果很好，但缺少递归检索命令。您可以使用它来获取列表，然后如上所述检索单个文件。

它并不完美，在这种情况下特别存在一个问题：尸体的mget 无法处理带有通配符的 args，这些通配符扩展为带有空格的文件名。
达夫文件系统2效果很好。我可以挂载该共享并从中复制文件。唯一的缺点是这不是 FUSE 文件系统，您需要 root 才能挂载它或/etc/fstab.

基于FUSE的数据文件系统-1.4.2-替代0.M51.1在这种情况下工作得很好，不需要root（仅需要权限/dev/fuse）。

mkdir viewRemote
wdfs https://public.me.com/ix/rudchenko/ viewRemote
rsync -a viewRemote/SEM*TO\ PRINT* ./
fusermount -u viewRemote
rmdir viewRemote

（当然，在本示例中，使用简单的cp替代方案rsync效果很好；rsync选择它只是为了在更新副本时对差异进行额外诊断。）

（除了 wdfs 之外，我在 Debian squeeze 系统上尝试了这些命令。您的情况可能会有所不同。）

Question 2

还有一些特殊的脚本和一个工具（wget-warc）来下载内容https://public.me.com/用户的文件夹——https://github.com/ArchiveTeam/mobileme-grab/blob/master/dld-me-com.sh（并查看包含的存储库）。（通过发现http://archiveteam.org/index.php?title=MobileMe#How_to_help_archiving.)

在内部，该脚本似乎组成 WebDAV 请求并使用响应，例如：

# step 1: download the list of files

if [[ "$domain" =~ "public.me.com" ]]
then

  # public.me.com has real WebDAV

  # PROPFIND with Depth: infinity lists all files
  echo -n "   - Discovering urls (XML)..."
  curl "https://public.me.com/ix/${username}/" \
       --silent \
       --request PROPFIND \
       --header "Content-Type: text/xml; charset=\"utf-8\"" \
       --header "Depth: infinity" \
       --data '<?xml version="1.0" encoding="utf-8"?><DAV:propfind xmlns:DAV="DAV:"><DAV:allprop/></DAV:propfind>' \
       --user-agent "${USER_AGENT}" \
     > "$userdir/webdav-feed.xml"
  result=$?
  if [ $result -ne 0 ]
  then
    echo " ERROR ($result)."
    exit 1
  fi
  echo " done."

  # grep for href, strip <D:href> and prepend https://public.me.com
  grep -o -E "<D:href>[^<]+" "$userdir/webdav-feed.xml" | cut -c 9- | awk '/[^\/]$/ { print "https://public.me.com" $1 }' > "$userdir/urls.txt"
  count=$( cat "$userdir/urls.txt" | wc -l )

elif

是的，他们也使用“https://public.me.com/ix/${用户名}/”，注意“/九/" URL 中的中缀！不是普通 URL --吉尔斯在他的回答中发现了同样的事情。

Answer

还有一些特殊的脚本和一个工具（wget-warc）来下载内容https://public.me.com/用户的文件夹——https://github.com/ArchiveTeam/mobileme-grab/blob/master/dld-me-com.sh（并查看包含的存储库）。（通过发现http://archiveteam.org/index.php?title=MobileMe#How_to_help_archiving.)

在内部，该脚本似乎组成 WebDAV 请求并使用响应，例如：

# step 1: download the list of files

if [[ "$domain" =~ "public.me.com" ]]
then

  # public.me.com has real WebDAV

  # PROPFIND with Depth: infinity lists all files
  echo -n "   - Discovering urls (XML)..."
  curl "https://public.me.com/ix/${username}/" \
       --silent \
       --request PROPFIND \
       --header "Content-Type: text/xml; charset=\"utf-8\"" \
       --header "Depth: infinity" \
       --data '<?xml version="1.0" encoding="utf-8"?><DAV:propfind xmlns:DAV="DAV:"><DAV:allprop/></DAV:propfind>' \
       --user-agent "${USER_AGENT}" \
     > "$userdir/webdav-feed.xml"
  result=$?
  if [ $result -ne 0 ]
  then
    echo " ERROR ($result)."
    exit 1
  fi
  echo " done."

  # grep for href, strip <D:href> and prepend https://public.me.com
  grep -o -E "<D:href>[^<]+" "$userdir/webdav-feed.xml" | cut -c 9- | awk '/[^\/]$/ { print "https://public.me.com" $1 }' > "$userdir/urls.txt"
  count=$( cat "$userdir/urls.txt" | wc -l )

elif

是的，他们也使用“https://public.me.com/ix/${用户名}/”，注意“/九/" URL 中的中缀！不是普通 URL --吉尔斯在他的回答中发现了同样的事情。

如何使用类似 wget 的工具从 public.me.com 复制其他人的文件夹？

答案1

答案2

相关内容