Guardar una página web como HTML o MHT usando Delphi

Al trabajar con Delphi, el TWebBrowser componente le permite crear un personalizado Aplicación de navegación web o para agregar Internet, exploración de archivos y redes, visualización de documentos y capacidades de descarga de datos a sus aplicaciones.

Cómo guardar una página web desde TWebBrowser

Al usar Internet Explorer, se le permite ver el código HTML fuente de una página y guardar esa página como un archivo en su unidad local. Si está viendo una página que desea conservar, vaya a Archivo / Guardar como... opción del menú. En el cuadro de diálogo que se abre, tiene varios tipos de archivos ofrecidos. Guardar la página como un tipo de archivo diferente afectará cómo se guarda la página.

El componente TWebBrowser (ubicado en la página "Internet" de la paleta de componentes) proporciona acceso a la funcionalidad del navegador web desde su Aplicaciones de Delphi. En general, querrá habilitar el almacenamiento de una página web que se muestra dentro de un WebBrowser como un archivo HTML en un disco.

instagram viewer

Guardar una página web como HTML sin formato

Si solo desea guardar una página web como HTML sin formato, seleccione "Página web, solo HTML (* .htm, * .html)". Simplemente guardará el código fuente HTML de la página actual en su disco intacto. Esta acción NO guardará los gráficos de la página o cualquier otro archivo utilizado dentro de la página, lo que significa que si carga el archivo desde el disco local, verá enlaces de imagen rotos.

A continuación, le mostramos cómo guardar una página web como HTML sin formato con el código Delphi:

Muestra de uso:

Notas

  • Las interfaces IPersistStreamInit e IStream se declaran dentro de la unidad ActiveX.
  • La página web se guarda como HTML sin procesar en el archivo WebBrowser1.html en la carpeta raíz de la unidad C.

MHT: Archivo web, archivo único

Cuando guarda una página web como "Archivo web, archivo único (* .mht)", el documento web se guarda en el formato HTML multipropósito de extensión de correo de Internet (MHTML) con una extensión de archivo .mht. Todos los enlaces relativos en la página web se reasignan y el contenido incrustado se incluye en el archivo .mht, en lugar de guardarse en una carpeta separada (como es el caso con "Página web, completa (* .htm, * .html) ").

MHTML le permite enviar y recibir páginas web y otros documentos HTML utilizando programas de correo electrónico como Microsoft Outlook y Microsoft Outlook Express; o incluso sus soluciones personalizadas de envío de correos electrónicos de Delphi. MHTML le permite incrustar imágenes directamente en el cuerpo de sus mensajes de correo electrónico en lugar de adjuntarlas al mensaje.

Aquí se explica cómo guardar una página web como un solo archivo (formato MHT) usando el código Delphi:

Uso de la muestra:

Nota

  • La clase _Stream se define en la unidad ADODB_TLB que probablemente ya haya creado. El código de las interfaces IMessage e IConfiguration de la biblioteca cdosys.dll. CDO significa Collaboration Data Objects, bibliotecas de objetos diseñadas para habilitar la mensajería SMTP.

El CDO_TLB es una unidad autogenerada por Delphi. Para crearlo, seleccione "Importar biblioteca de tipos" en el menú principal, seleccione "C: \ WINDOWS \ system32 \ cdosys.dll" y luego haga clic en el botón "Crear unidad".

No TWebBrowser

Puede volver a escribir el procedimiento WB_SaveAs_MHT para aceptar una cadena de URL (no TWebBrowser) para poder guardar una página web directamente, sin necesidad de usar el componente WebBrowser. La URL de WebBrowser se recupera utilizando la propiedad WB.LocationURL.

instagram story viewer