ยินดีต้อนรับคุณ, บุคคลทั่วไป กรุณา เข้าสู่ระบบ หรือ ลงทะเบียน

เข้าสู่ระบบด้วยชื่อผู้ใช้ รหัสผ่าน และระยะเวลาในเซสชั่น

ThaiSEOBoard.comพัฒนาเว็บไซต์Programmingถ้าจะเขียนสคริป redirect เว็บคนที่ขโมยข้อมูลไปใช้นี่ต้องทำแบบไหนครับ
หน้า: [1]   ลงล่าง
พิมพ์
ผู้เขียน หัวข้อ: ถ้าจะเขียนสคริป redirect เว็บคนที่ขโมยข้อมูลไปใช้นี่ต้องทำแบบไหนครับ  (อ่าน 938 ครั้ง)
0 สมาชิก และ 1 บุคคลทั่วไป กำลังดูหัวข้อนี้
teabreak
คนรักเสียว
*

พลังน้ำใจ: 12
ออฟไลน์ ออฟไลน์

กระทู้: 180



ดูรายละเอียด
« เมื่อ: 16 พฤษภาคม 2017, 00:34:37 »

พอดีว่าเว็บไซต์โดนขโมยข้อมูลไปใช้ โดยที่ไม่มีการขออนุญาติน่ะครับ

เลยอยากจะเขียนสคริปว่าถ้าข้อมูลถูกโหลด โดยโดเมนอื่นๆที่ไม่ใช่ aaa.com นี้ ให้ redirect ไปที่ url aaa.com

ต้องเขียนยังไงหรอครับ

รบกวนด้วยครับ

ขอบคุณครับ
บันทึกการเข้า
nuonly
หัวหน้าแก๊งเสียว
*

พลังน้ำใจ: 143
ออฟไลน์ ออฟไลน์

กระทู้: 2,694



ดูรายละเอียด
« ตอบ #1 เมื่อ: 16 พฤษภาคม 2017, 00:40:31 »

โค๊ด:
Options +FollowSymLinks
RewriteEngine On
RewriteCond %{HTTP_HOST} ^www.olddomain.com$ [OR]
RewriteCond %{HTTP_HOST} ^olddomain.com$
RewriteRule (.*)$ http://www.newdomain.com/$1 [R=301,L]


โค๊ด:
<?
Header( "HTTP/1.1 301 Moved Permanently" );
Header( "Location: http://www.เว็บใหม่.com" );
?>
บันทึกการเข้า

teabreak
คนรักเสียว
*

พลังน้ำใจ: 12
ออฟไลน์ ออฟไลน์

กระทู้: 180



ดูรายละเอียด
« ตอบ #2 เมื่อ: 16 พฤษภาคม 2017, 00:44:38 »

โค๊ด:
Options +FollowSymLinks
RewriteEngine On
RewriteCond %{HTTP_HOST} ^www.olddomain.com$ [OR]
RewriteCond %{HTTP_HOST} ^olddomain.com$
RewriteRule (.*)$ http://www.newdomain.com/$1 [R=301,L]


โค๊ด:
<?
Header( "HTTP/1.1 301 Moved Permanently" );
Header( "Location: http://www.เว็บใหม่.com" );
?>




ขอบคุณครับ

แบบนี้มันต้องใส่ใน หัวเว็บใช่หรือเปล่าครับ

แต่ของผมคือโดนตัดบางช่วงในเว็บเอาไปใช้ เลยอยากได้เป็นแบบ java script แทรกไว้ในเว็บตรงส่วนที่โดนเอาไปใช้

ไม่ทราบว่าต้องใช้แบบไหนครับ
บันทึกการเข้า
nuonly
หัวหน้าแก๊งเสียว
*

พลังน้ำใจ: 143
ออฟไลน์ ออฟไลน์

กระทู้: 2,694



ดูรายละเอียด
« ตอบ #3 เมื่อ: 16 พฤษภาคม 2017, 00:49:35 »

โค๊ด:
Options +FollowSymLinks
RewriteEngine On
RewriteCond %{HTTP_HOST} ^www.olddomain.com$ [OR]
RewriteCond %{HTTP_HOST} ^olddomain.com$
RewriteRule (.*)$ http://www.newdomain.com/$1 [R=301,L]


โค๊ด:
<?
Header( "HTTP/1.1 301 Moved Permanently" );
Header( "Location: http://www.เว็บใหม่.com" );
?>




ขอบคุณครับ

แบบนี้มันต้องใส่ใน หัวเว็บใช่หรือเปล่าครับ

แต่ของผมคือโดนตัดบางช่วงในเว็บเอาไปใช้ เลยอยากได้เป็นแบบ java script แทรกไว้ในเว็บตรงส่วนที่โดนเอาไปใช้

ไม่ทราบว่าต้องใช้แบบไหนครับ


หามาให้จากในบอร์ดนี่้ครับ
Redirect แต่ละหน้า : เอาไว้สำหรับ Redirect บางหน้า วิธีก็คือ ใส่ Code นี้ใน File .htaccess
โค๊ด:
Redirect 301 /oldpage.html http://www.yoursite.com/newpage.html

#Redirect ทั้ง Website เลย : เหมาะกับคนที่เปลี่ยน Domian ใหม่ วิธีก็คือ ใส่ Code นี้ใน File .htaccess
โค๊ด:
Redirect 301 / http://www.newsite.com/

#Redirect สกุล File : อันนี้อาจจะเหมาะกับคนที่อาจจะเปลี่ยน Hosting ซึ่งอาจจะไม่ Support file บางอย่างเลยต้องเปลี่ยนไปใช้ File อื่น เช่น เปลี่ยน Host ที่ Run โดย IIS มาเป็น Host ที่ใช้ Apache ซึ่งของเดิม File อาจจะเป็น asp ก็ต้องเปลี่ยนมาเป็น php หรือ html วิธีก็คือ ใส่ Code นี้ใน File .htaccess
โค๊ด:
RedirectMatch 301 (.*).asp$ http://www.example.com $1.php
แต่ว่าในกรณีนี้ชื่อ File ต้องเหมือนกันนะครับ เช่น contact.asp กับ contact.php
 
#Redirect จากที่ไม่มี www ให้ไป URL ที่มี www วิธีก็คือ ใส่ Code นี้ใน File .htaccess
โค๊ด:
Options +FollowSymLinks
RewriteEngine on
RewriteCond %{HTTP_HOST} ^yoursite.com [NC]
RewriteRule ^(.*)$ [url]http://www.yoursite.com/[/url]$1 [L,R=301]
เนื่องจากบางกรณี Search Engine จะมองว่า เวปไซต์ http://yoursite.com  กับ http://www.yoursite.com  นั้น เป็นคนละเวปกัน
« แก้ไขครั้งสุดท้าย: 16 พฤษภาคม 2017, 00:50:16 โดย nuonly » บันทึกการเข้า

teabreak
คนรักเสียว
*

พลังน้ำใจ: 12
ออฟไลน์ ออฟไลน์

กระทู้: 180



ดูรายละเอียด
« ตอบ #4 เมื่อ: 16 พฤษภาคม 2017, 00:58:01 »

ขอบคุณคุณ nuonly มากๆครับ

แต่อันนั้นสำหรับ Redirect เว็บเก่าไปเว็บใหม่ใช่หรือเปล่าครับ

กรณีของผมนี่ต้องการ redirect เว็บของคนที่ขโมยข้อมูลไปใช้ โดยให้ redirect กลับมาที่เว็บของผมน่ะครับ

ผมลองหาจากในบอร์ดมีกระทู้

http://www.thaiseoboard.com/index.php?topic=179328.0

pm ไปแล้วนะครับ ลองดูครับ

อันนี้เอาไว้เผื่อคนอื่นโดนดึงนะครับ

โค๊ด:
<?
$badweb = "http://www.verybad.com/download/"; //ตรงนี้ใส่หน้าเว็บที่ดึงของเราไป

$refer = $_SERVER['HTTP_REFERER'];

if($refer==$badweb){
echo '
<script langquage='javascript'>
window.parent.location="http://www.google.com/";
</script>';
exit();
}

?>



แต่ผมไม่รู้ว่าจะแทรกโค๊ดนี้ยังไงอ่ะครับ  Tongue

แล้วถ้าเป็น asp จะใช้ยังไงอ่ะครับ
บันทึกการเข้า
nuonly
หัวหน้าแก๊งเสียว
*

พลังน้ำใจ: 143
ออฟไลน์ ออฟไลน์

กระทู้: 2,694



ดูรายละเอียด
« ตอบ #5 เมื่อ: 16 พฤษภาคม 2017, 01:00:05 »

ขอบคุณคุณ nuonly มากๆครับ

แต่อันนั้นสำหรับ Redirect เว็บเก่าไปเว็บใหม่ใช่หรือเปล่าครับ

กรณีของผมนี่ต้องการ redirect เว็บของคนที่ขโมยข้อมูลไปใช้ โดยให้ redirect กลับมาที่เว็บของผมน่ะครับ

ผมลองหาจากในบอร์ดมีกระทู้

http://www.thaiseoboard.com/index.php?topic=179328.0

pm ไปแล้วนะครับ ลองดูครับ

อันนี้เอาไว้เผื่อคนอื่นโดนดึงนะครับ

โค๊ด:
<?
$badweb = "http://www.verybad.com/download/"; //ตรงนี้ใส่หน้าเว็บที่ดึงของเราไป

$refer = $_SERVER['HTTP_REFERER'];

if($refer==$badweb){
echo '
<script langquage='javascript'>
window.parent.location="http://www.google.com/";
</script>';
exit();
}

?>



แต่ผมไม่รู้ว่าจะแทรกโค๊ดนี้ยังไงอ่ะครับ  Tongue

แล้วถ้าเป็น asp จะใช้ยังไงอ่ะครับ


อ้อถ้าเป็น asp รอท่านอื่นเลยครับ ผมไม่ถนัดครับ  :'(
บันทึกการเข้า

teabreak
คนรักเสียว
*

พลังน้ำใจ: 12
ออฟไลน์ ออฟไลน์

กระทู้: 180



ดูรายละเอียด
« ตอบ #6 เมื่อ: 16 พฤษภาคม 2017, 01:02:37 »

ขอบคุณคุณ nuonly มากๆครับ

แต่อันนั้นสำหรับ Redirect เว็บเก่าไปเว็บใหม่ใช่หรือเปล่าครับ

กรณีของผมนี่ต้องการ redirect เว็บของคนที่ขโมยข้อมูลไปใช้ โดยให้ redirect กลับมาที่เว็บของผมน่ะครับ

ผมลองหาจากในบอร์ดมีกระทู้

http://www.thaiseoboard.com/index.php?topic=179328.0

pm ไปแล้วนะครับ ลองดูครับ

อันนี้เอาไว้เผื่อคนอื่นโดนดึงนะครับ

โค๊ด:
<?
$badweb = "http://www.verybad.com/download/"; //ตรงนี้ใส่หน้าเว็บที่ดึงของเราไป

$refer = $_SERVER['HTTP_REFERER'];

if($refer==$badweb){
echo '
<script langquage='javascript'>
window.parent.location="http://www.google.com/";
</script>';
exit();
}

?>



แต่ผมไม่รู้ว่าจะแทรกโค๊ดนี้ยังไงอ่ะครับ  Tongue

แล้วถ้าเป็น asp จะใช้ยังไงอ่ะครับ


อ้อถ้าเป็น asp รอท่านอื่นเลยครับ ผมไม่ถนัดครับ  :'(


แค่มาช่วยก็ขอบคุณมากๆแล้วครับ  wanwan017
บันทึกการเข้า
goragod
ก๊วนเสียว
*

พลังน้ำใจ: 45
ออฟไลน์ ออฟไลน์

กระทู้: 221



ดูรายละเอียด
« ตอบ #7 เมื่อ: 16 พฤษภาคม 2017, 08:57:41 »

คิดว่าน่าจะแอบยากนิดนึง เพราะเขาตัดเอาแค่เฉพาะเนื้อหาออก ซึ่งสคริปต์ที่เราแทรกไว้ ก็คงถูกตัดออกได้เช่นกัน ผมแนะนำว่าคงต้องเลี่ยงไปใช้วิธีตรวจสอบทางตรง (search แล้วแจ้งเจ้าของ) หรือไม่ก็ใช้กฎหมาย น่าจะโอเคกว่า
บันทึกการเข้า

infamous
ก๊วนเสียว
*

พลังน้ำใจ: 14
ออฟไลน์ ออฟไลน์

กระทู้: 295



ดูรายละเอียด
« ตอบ #8 เมื่อ: 16 พฤษภาคม 2017, 09:20:19 »

ปัญหานี้ผมเคยโดนครับ ช่วงนั้นไปอ่านตามบอร์ดตปท. เพื่อหาวิธีบ่อยมาก จนเริ่มเครียด
สุดท้ายต้องปล่อยมันเข้ามา และเอาข้อมูลไปครับ แต่ผมจะเก็บประวัติมันไว้ทุกอย่างทีสามารถเก็บได้
จากนั้นดูว่ามันเข้ามาบ่อยไหม ถ้าบ่อยแสดงว่ายังไม่รู้ตัว(เพราะเราไม่อยากให้มันรู้) จากนั้นอ้อมไปดัดหลังมันเลยครับ
โดยผมจะไม่แจ้งให้ลบข้อมูลออกโดยตรง แต่จะส่ง large number of http request ไปบอมบ์เว็บมันเลย ซึ่งผมเขียนบอทชั่วโมงเดียวก็เสร็จแล้ว
ยิงแช่ท้ิงไว้สัก 1 อาทิตย์ให้มันเริ่มรู้ตัวและประสาทเสีย เหมือนกับที่ผมเคยเป็น
จากนั้นหยุดยิงสักสองสามวัน รอให้เรื่องเงียบ หรือรอให้เว็บมันออนไลน์ขึ้นมาใหม่ จากนั้นค่อยแจ้งให้มันเอาข้อมูลออก เพราะถ้าไม่เอาออกมันจะโดนอีก และหนักกว่าเดิม
ซึ่งถ้าปลายทางเป็น wordpress แบบ shared host นี่กินหมูเลยครับยิงแป๊ปเดียว จมทันที

------

การแก้ไขแบบใสสะอาด

ลองดูเทคนิคนี้ครับ

1. หน้าเพจ A แสดง HTML แบบเปล่าๆ ไม่มีอะไร (Empty) สมมติ product-001.html
2. html ในข้อ 1 เขียนสคริปต์ส่ง request ไปหา reverse_proxy.php โดยต้องระบุ ip,host,referer,special header ไปให้กับไฟล์ reverse_proxy.php ด้วย
3. ไฟล์ reverse_proxy.php ทำการ validate + filter ข้อมูล request ว่าได้ส่งจาก ip,host หรือข้อมูลอื่นๆที่จำเป็นต้องใช้ในการ validate จากต้นทางจริงหรือไม่
4. ถ้าข้อมูลถูกต้อง ให้ทำการดึงข้อมูลที่ต้องการแสดงผลจริงกลับไปให้หน้าเพจ A

อันนี้ผมเคยทำครับ ได้ผลเป็นที่น่าพอใจ แต่มันจะมีปัญหากับ SEO ครับ เพราะเวลาบอทเข้ามาเก็บข้อมูลมันจะได้ข้อมูลที่ไม่ใช่ข้อมูลจริงๆของหน้าเว็บไซต์นั้นๆ
บันทึกการเข้า
goragod
ก๊วนเสียว
*

พลังน้ำใจ: 45
ออฟไลน์ ออฟไลน์

กระทู้: 221



ดูรายละเอียด
« ตอบ #9 เมื่อ: 16 พฤษภาคม 2017, 10:05:43 »

1. หน้าเพจ A แสดง HTML แบบเปล่าๆ ไม่มีอะไร (Empty) สมมติ product-001.html
2. html ในข้อ 1 เขียนสคริปต์ส่ง request ไปหา reverse_proxy.php โดยต้องระบุ ip,host,referer,special header ไปให้กับไฟล์ reverse_proxy.php ด้วย
3. ไฟล์ reverse_proxy.php ทำการ validate + filter ข้อมูล request ว่าได้ส่งจาก ip,host หรือข้อมูลอื่นๆที่จำเป็นต้องใช้ในการ validate จากต้นทางจริงหรือไม่
4. ถ้าข้อมูลถูกต้อง ให้ทำการดึงข้อมูลที่ต้องการแสดงผลจริงกลับไปให้หน้าเพจ A

จริงๆ เทคนิคนี้ก็ใช้ได้ครับ แต่ก็ไม่ 100% หรอก ยังเอาเนื้อหาออกมาได้อยู่ดี ตัวอย่าง http://gcms.in.th สังเกตุ URL ที่มี # นั่นคือ URL ที่คนเข้าถึง ส่วน bot จะมี URL รูปแบบ .html ธรรมดา โดยอาศัย URL จาก sitemap ซึ่งเราสามารถ detect ได้ว่าเป็น bot หรือไม่ ถ้าใช่ก็ส่งเนื้อหาเต็มๆไป วิธันี้จะไม่มีผลด้าน SEO

หมายเหตุ เว็บนั่นไม่ได้ detect bot นะครับ ผมชี้ให้เห็นหลักการเฉยๆ
บันทึกการเข้า

infamous
ก๊วนเสียว
*

พลังน้ำใจ: 14
ออฟไลน์ ออฟไลน์

กระทู้: 295



ดูรายละเอียด
« ตอบ #10 เมื่อ: 16 พฤษภาคม 2017, 10:51:38 »

1. หน้าเพจ A แสดง HTML แบบเปล่าๆ ไม่มีอะไร (Empty) สมมติ product-001.html
2. html ในข้อ 1 เขียนสคริปต์ส่ง request ไปหา reverse_proxy.php โดยต้องระบุ ip,host,referer,special header ไปให้กับไฟล์ reverse_proxy.php ด้วย
3. ไฟล์ reverse_proxy.php ทำการ validate + filter ข้อมูล request ว่าได้ส่งจาก ip,host หรือข้อมูลอื่นๆที่จำเป็นต้องใช้ในการ validate จากต้นทางจริงหรือไม่
4. ถ้าข้อมูลถูกต้อง ให้ทำการดึงข้อมูลที่ต้องการแสดงผลจริงกลับไปให้หน้าเพจ A

จริงๆ เทคนิคนี้ก็ใช้ได้ครับ แต่ก็ไม่ 100% หรอก ยังเอาเนื้อหาออกมาได้อยู่ดี ตัวอย่าง http://gcms.in.th สังเกตุ URL ที่มี # นั่นคือ URL ที่คนเข้าถึง ส่วน bot จะมี URL รูปแบบ .html ธรรมดา โดยอาศัย URL จาก sitemap ซึ่งเราสามารถ detect ได้ว่าเป็น bot หรือไม่ ถ้าใช่ก็ส่งเนื้อหาเต็มๆไป วิธันี้จะไม่มีผลด้าน SEO

หมายเหตุ เว็บนั่นไม่ได้ detect bot นะครับ ผมชี้ให้เห็นหลักการเฉยๆ


1. อันนี้ผมยังไม่ได้ลงรายละเอียดนะครับว่ามันสามารถแก้ไขปัญหาได้ 100% เพราะการป้องกันการ copy เนื้อหามันทำได้ยากอยู่แล้ว แต่ถ้าคุณหรือใครๆลองทำหรือเพิ่มการตรวจสอบในเรื่องของ http request คุณจะรู้ว่าคุณสามารถหยุดปัญหานี้ได้ ถ้า request นั้นมาจากฝีมือมนุษย์ ไม่ใช่ bot ของ gg,bing,yahoo หรือตัวอื่นๆ

2. บางท่านอาจจะคิดว่า bot สามารถใต่และ indexed หน้าเพจที่เป็น .html หรือ extension อื่นๆ เท่านั้น อันนี้ต้องคิดใหม่นะครับ เพราะ bot มันฉลาดกว่าโปรแกรมเมอร์บางท่านเสียอีก แค่คุณทำลิงค์ให้มันใต่ และไม่ได้บล็อกมัน และถึงแม้ว่าลิงค์นั้นจะไม่อยู่ใน sitemap หรือเป็น/มี hashtag(#) ก็ตาม เพราะบอทมันสามารถ read dom ได้ครับ

3. เรทการป้องกันว่าสามารถป้องกันได้ขนาดไหน มันอยู่ที่ระบบของเราว่าฉลาดขนาดไหน และขึ้นอยู่กับความฉลาดของฝั่งที่จะเอาข้อมูลด้วย อันนี้น่าจะเห็นภาพนะครับ

ปล. หากผมเข้าใจผิดส่วนใด ก็ต้องขออภัยด้วยครับ
บันทึกการเข้า
goragod
ก๊วนเสียว
*

พลังน้ำใจ: 45
ออฟไลน์ ออฟไลน์

กระทู้: 221



ดูรายละเอียด
« ตอบ #11 เมื่อ: 16 พฤษภาคม 2017, 12:28:29 »

1. หน้าเพจ A แสดง HTML แบบเปล่าๆ ไม่มีอะไร (Empty) สมมติ product-001.html
2. html ในข้อ 1 เขียนสคริปต์ส่ง request ไปหา reverse_proxy.php โดยต้องระบุ ip,host,referer,special header ไปให้กับไฟล์ reverse_proxy.php ด้วย
3. ไฟล์ reverse_proxy.php ทำการ validate + filter ข้อมูล request ว่าได้ส่งจาก ip,host หรือข้อมูลอื่นๆที่จำเป็นต้องใช้ในการ validate จากต้นทางจริงหรือไม่
4. ถ้าข้อมูลถูกต้อง ให้ทำการดึงข้อมูลที่ต้องการแสดงผลจริงกลับไปให้หน้าเพจ A

จริงๆ เทคนิคนี้ก็ใช้ได้ครับ แต่ก็ไม่ 100% หรอก ยังเอาเนื้อหาออกมาได้อยู่ดี ตัวอย่าง http://gcms.in.th สังเกตุ URL ที่มี # นั่นคือ URL ที่คนเข้าถึง ส่วน bot จะมี URL รูปแบบ .html ธรรมดา โดยอาศัย URL จาก sitemap ซึ่งเราสามารถ detect ได้ว่าเป็น bot หรือไม่ ถ้าใช่ก็ส่งเนื้อหาเต็มๆไป วิธันี้จะไม่มีผลด้าน SEO

หมายเหตุ เว็บนั่นไม่ได้ detect bot นะครับ ผมชี้ให้เห็นหลักการเฉยๆ


1. อันนี้ผมยังไม่ได้ลงรายละเอียดนะครับว่ามันสามารถแก้ไขปัญหาได้ 100% เพราะการป้องกันการ copy เนื้อหามันทำได้ยากอยู่แล้ว แต่ถ้าคุณหรือใครๆลองทำหรือเพิ่มการตรวจสอบในเรื่องของ http request คุณจะรู้ว่าคุณสามารถหยุดปัญหานี้ได้ ถ้า request นั้นมาจากฝีมือมนุษย์ ไม่ใช่ bot ของ gg,bing,yahoo หรือตัวอื่นๆ

2. บางท่านอาจจะคิดว่า bot สามารถใต่และ indexed หน้าเพจที่เป็น .html หรือ extension อื่นๆ เท่านั้น อันนี้ต้องคิดใหม่นะครับ เพราะ bot มันฉลาดกว่าโปรแกรมเมอร์บางท่านเสียอีก แค่คุณทำลิงค์ให้มันใต่ และไม่ได้บล็อกมัน และถึงแม้ว่าลิงค์นั้นจะไม่อยู่ใน sitemap หรือเป็น/มี hashtag(#) ก็ตาม เพราะบอทมันสามารถ read dom ได้ครับ

3. เรทการป้องกันว่าสามารถป้องกันได้ขนาดไหน มันอยู่ที่ระบบของเราว่าฉลาดขนาดไหน และขึ้นอยู่กับความฉลาดของฝั่งที่จะเอาข้อมูลด้วย อันนี้น่าจะเห็นภาพนะครับ

ปล. หากผมเข้าใจผิดส่วนใด ก็ต้องขออภัยด้วยครับ


เพื่อป้องกันการเข้าใจผิด ผมไม่ได้ดิสเครดิตข้อความของท่านนะครับ

1 ผมเห็นด้วยกับความคิเห้น สำหรับวิธีนี้ ซึ่งสามารถทำได้เทียบกับแนวคิดที่ผมทำอยู่ คือ gcms.in.th ข้อแตกต่างของผมกับที่คุณว่า คือผมไม่ได้บล๊อกบอต แต่ต้องการบอกว่า ถึงเราจะใช้ javascript โหลดเนื้อหา เราก็ยังสามารถทำให้มันไม่มีผลเสียด้าน seo ได้
2 Google ยังไม่เข้าใจ Javascript นะครับ และ มันก็ไม่ได้อ่าน Dom เพราะถ้ามนทำได้ การใช้ Ajax โหลดเนื้อหามาแสดง ก็จะไม่มีผลเสียด้าน SEO (bot ใช้วิธีอ่านข้อความเอาครับ)
3 ไม่มีวิธี 100% จริงๆครับ ไม่ว่าจะใช้เทคนิคไหน

ต้องขออภัยด้วยนะครับ ที่อาจทำให้ท่านเข้าใจผิด  wanwan017

ถ้า จขกท(หมายถึงคนถามนะครับ) มีปัญหาจริงๆ ผมแนะนำให้ใช้วิธีการทางกฎหมายมากกว่าครับ (ส่วนตัวผมก็ทำแบบนี้)
« แก้ไขครั้งสุดท้าย: 16 พฤษภาคม 2017, 12:33:57 โดย goragod » บันทึกการเข้า

infamous
ก๊วนเสียว
*

พลังน้ำใจ: 14
ออฟไลน์ ออฟไลน์

กระทู้: 295



ดูรายละเอียด
« ตอบ #12 เมื่อ: 16 พฤษภาคม 2017, 12:55:56 »

1. หน้าเพจ A แสดง HTML แบบเปล่าๆ ไม่มีอะไร (Empty) สมมติ product-001.html
2. html ในข้อ 1 เขียนสคริปต์ส่ง request ไปหา reverse_proxy.php โดยต้องระบุ ip,host,referer,special header ไปให้กับไฟล์ reverse_proxy.php ด้วย
3. ไฟล์ reverse_proxy.php ทำการ validate + filter ข้อมูล request ว่าได้ส่งจาก ip,host หรือข้อมูลอื่นๆที่จำเป็นต้องใช้ในการ validate จากต้นทางจริงหรือไม่
4. ถ้าข้อมูลถูกต้อง ให้ทำการดึงข้อมูลที่ต้องการแสดงผลจริงกลับไปให้หน้าเพจ A

จริงๆ เทคนิคนี้ก็ใช้ได้ครับ แต่ก็ไม่ 100% หรอก ยังเอาเนื้อหาออกมาได้อยู่ดี ตัวอย่าง http://gcms.in.th สังเกตุ URL ที่มี # นั่นคือ URL ที่คนเข้าถึง ส่วน bot จะมี URL รูปแบบ .html ธรรมดา โดยอาศัย URL จาก sitemap ซึ่งเราสามารถ detect ได้ว่าเป็น bot หรือไม่ ถ้าใช่ก็ส่งเนื้อหาเต็มๆไป วิธันี้จะไม่มีผลด้าน SEO

หมายเหตุ เว็บนั่นไม่ได้ detect bot นะครับ ผมชี้ให้เห็นหลักการเฉยๆ


1. อันนี้ผมยังไม่ได้ลงรายละเอียดนะครับว่ามันสามารถแก้ไขปัญหาได้ 100% เพราะการป้องกันการ copy เนื้อหามันทำได้ยากอยู่แล้ว แต่ถ้าคุณหรือใครๆลองทำหรือเพิ่มการตรวจสอบในเรื่องของ http request คุณจะรู้ว่าคุณสามารถหยุดปัญหานี้ได้ ถ้า request นั้นมาจากฝีมือมนุษย์ ไม่ใช่ bot ของ gg,bing,yahoo หรือตัวอื่นๆ

2. บางท่านอาจจะคิดว่า bot สามารถใต่และ indexed หน้าเพจที่เป็น .html หรือ extension อื่นๆ เท่านั้น อันนี้ต้องคิดใหม่นะครับ เพราะ bot มันฉลาดกว่าโปรแกรมเมอร์บางท่านเสียอีก แค่คุณทำลิงค์ให้มันใต่ และไม่ได้บล็อกมัน และถึงแม้ว่าลิงค์นั้นจะไม่อยู่ใน sitemap หรือเป็น/มี hashtag(#) ก็ตาม เพราะบอทมันสามารถ read dom ได้ครับ

3. เรทการป้องกันว่าสามารถป้องกันได้ขนาดไหน มันอยู่ที่ระบบของเราว่าฉลาดขนาดไหน และขึ้นอยู่กับความฉลาดของฝั่งที่จะเอาข้อมูลด้วย อันนี้น่าจะเห็นภาพนะครับ

ปล. หากผมเข้าใจผิดส่วนใด ก็ต้องขออภัยด้วยครับ


เพื่อป้องกันการเข้าใจผิด ผมไม่ได้ดิสเครดิตข้อความของท่านนะครับ

1 ผมเห็นด้วยกับความคิเห้น สำหรับวิธีนี้ ซึ่งสามารถทำได้เทียบกับแนวคิดที่ผมทำอยู่ คือ gcms.in.th ข้อแตกต่างของผมกับที่คุณว่า คือผมไม่ได้บล๊อกบอต แต่ต้องการบอกว่า ถึงเราจะใช้ javascript โหลดเนื้อหา เราก็ยังสามารถทำให้มันไม่มีผลเสียด้าน seo ได้
2 Google ยังไม่เข้าใจ Javascript นะครับ และ มันก็ไม่ได้อ่าน Dom เพราะถ้ามนทำได้ การใช้ Ajax โหลดเนื้อหามาแสดง ก็จะไม่มีผลเสียด้าน SEO (bot ใช้วิธีอ่านข้อความเอาครับ)
3 ไม่มีวิธี 100% จริงๆครับ ไม่ว่าจะใช้เทคนิคไหน

ต้องขออภัยด้วยนะครับ ที่อาจทำให้ท่านเข้าใจผิด  wanwan017

ถ้า จขกท(หมายถึงคนถามนะครับ) มีปัญหาจริงๆ ผมแนะนำให้ใช้วิธีการทางกฎหมายมากกว่าครับ (ส่วนตัวผมก็ทำแบบนี้)


ผมขอโทษนะครับ คือผมสงสัยว่าท่านน่าจะเป็นผุ้พัฒนา gcms แต่ทำไมท่านไม่รุ้ว่า google หรือ googlebot นั้นสามารถ execute js/ajax ได้ตั้งนานแล้ว เพราะออกมาตีพวก auto gen content หรือ dynamic content ผ่านทาง js

Ref: https://www.webmasterworld.com/google/4382245.htm
บันทึกการเข้า
navico
Verified Seller
หัวหน้าแก๊งเสียว
*

พลังน้ำใจ: 108
ออฟไลน์ ออฟไลน์

กระทู้: 2,315



ดูรายละเอียด เว็บไซต์
« ตอบ #13 เมื่อ: 17 พฤษภาคม 2017, 17:09:18 »

สงสัยครับ content ที่ว่านี่คืออะไรครับ โดนดึงในลักษณะยังไง เป็นรูป หรือ โดนดึงหน้าเว็บผ่าน iframe หรือ Huh??



ถ้าเป็นรูป search "image hotlinking protection"
ถ้าโดน iframe => https://www.sitepoint.com/java...people-hotlinking-site-iframes
« แก้ไขครั้งสุดท้าย: 17 พฤษภาคม 2017, 17:12:36 โดย navico » บันทึกการเข้า
หน้า: [1]   ขึ้นบน
พิมพ์