sql >> Databasteknik >  >> RDS >> Mysql

url-textkomprimering (inte förkortning) och lagring i mysql

En annan idé att prova kan vara att identifiera vanliga strängar och representera dem med en bitmapp. Ha till exempel två bitar för att representera protokollet (http, https, ftp eller något annat), en annan bit för att indikera om domänen börjar med "wwww", två bitar för att indikera om domänen slutar med ".com", ". org", ".edu" eller något annat. Du måste göra lite analys av dina data och se om dessa är vettiga och om det finns några andra vanliga strängar du kan identifiera.

Om du har många webbadresser till samma webbplats kan du också överväga att dela upp din tabell i två olika, den ena innehåller domänen och den andra innehåller den domänrelativa sökvägen (och frågesträng och fragment-id, om det finns). Du skulle ha en länktabell som hade webbadressens ID, domänens ID och sökvägens ID, och du skulle ersätta din ursprungliga URL-tabell med en vy som sammanfogade de tre tabellerna. Domäntabellen behöver inte vara begränsad till domänen, du kan inkludera så mycket av webbadressen som var vanligt (t.ex. 'http://stackoverflow.com/questions'). Detta skulle inte kräva för mycket kod att implementera och har fördelen av att det fortfarande är läsbart. Din numeriska kodning kan vara effektivare, när du väl har kommit på det måste du analysera dina data för att se vilken som är mer vettig.



  1. uppdatera tabellkolumnen efter att ha infogat ny post med MySQL-utlösare

  2. Jämför två strängar i MySQL

  3. Möjligt att göra en MySQL främmande nyckel till en av två möjliga tabeller?

  4. Skapa primärnyckelfel på postgresql, heroku, Rails 4