Fick frågan - Vad är en cosmid? - av en student igår. Lite hastigt sa jag att det är som en plasmid, men att den kan innehålla stora mängder extra DNA, till exempel genomiskt DNA. Men det fick mig att fundera över vad som faktiskt definierar en cosmid. Så satte mig och läste på lite och skrev en liten artikel som studenten ska få på måndag.
Cosmider utvecklades under sena 1970-talet som ett svar på behovet av vektorer kapabla att ackommodera stora segment av genomiskt DNA. Cosmider är konventionella plasmider som har ett prokaryotiskt replikationsorigin (vanligtvis colE1 eller pMB1), en selektionsmarkör och en eller flera restriktionsplatser som kan användas för att stoppa in segment av genomiskt DNA. Cosmider har även ett, eller oftare två kopior av en liten region av bakteriofag lambda DNA - den 280 bp cos-sekvensen - som kan klyvas av lambda-kodade terminasproteinet för att generera linjära molekyler med 12 baser i längd komplementära ssDNA-ändar. Rekombinanta cosmider som bär på segment av genomiskt DNA klyvt av lambda terminas kan packas in vitro i bakteriofag lambda partiklar och transduceras till Escherichia coli. När den rekombinanta cosmiden väl är inne i bakterien cirkulariseras den och replikeras sedan som en stor konventionell plasmid med ett kopieantal 15-20 per cell. Denna trojanska häst av in vitro packning och transduktion designades för att lösa problemet med att effektivt introducera stora plasmider i E. coli.
Tyvärr så fanns det ett problem med cosmiderna - deras kapacitet var helt enkelt inte tillräckligt stor för att effektivt handskas med något så stort som ett däggdjurs genom. Cosmider är tillräckligt stora för att kunna ackommodera en typisk prokaryot gen, men inte en hel typisk däggdjursgen. (På grund av att den maximala mängden DNA som kan packas i en bakteriofag lambda partikel är 52 kb. Cosmidvektorer som vanligtvis är 8 kb i storlek kan ackommodera mellan 31 till 44 kb av främmande DNA). Segment av genomiskt DNA i denna storleksordning genereras genom partiell klyvning av genomiskt DNA med ett restriktionsenzym så som Sau3A som känner igen en 4-bp sekvens och genererar klibbiga ändar. DNA fragment av passande storlek isoleras genom sukros gradientcentrifugering och ligeras till en cosmidvektor som lineariserats med BamHI.
Cos härstammar från cohesive site. Cos-sekvensen är ett 200 bp långt segment som behövs både för att initiera och terminera packningen av ett monomert genom från konkatemeriskt DNA. Stället där terminase introducerar ett hack för att generera klibbiga ändar kallas cosN. När lambdafager började att studeras så trodde man att cosN var nödvändigt och tillräckligt för att DNA skulle packas i capsiden. Senare studier visade att cos är mer komplext och består av 3 eller kanske 4 distinkta subsäten. Både initiering och terminering av packning kräver att ena DNA-strängen hos cosN-sätet har klippts. Dessutom krävs närvaron av ett det så kallade cosB-sätet, vilket går att hitta direkt nerströms efter cosN. För terminering är det även viktigt att det finns ett så kallat cosQ-site som är lokaliserat upströms av cosN. I2 är en sekvens som finns mellan cosN och cosB som också har en distinkt roll i att DNAt packas effektivt. Så den fullständiga cos-sekvensen består av flera subsäten, där varje subsäte spelar en specifik roll i igenkänning, bearbetning, och packning av viralt DNA.
Inne i cellen är DNA associerat med proteiner och varje DNA-molekyl med dess proteiner kallas för en kromosom. Detta sätt att organisera DNA på gäller för prokaryoter, eukaryoter, och även virus. Att packa DNA i kromosomer fyller flera viktiga funktioner. För det första, är kromosomen en kompakt form av DNA som får plats i cellen. För det andra, så är DNA packat i kromosomer skyddade från DNA-skador. Opackat DNA är relativt instabilt inne i cellen, i kontrast till kromosomalt DNA som är väldigt stabilt. För det tredje, endast en väl packad kromosom kan effektivt fördelas jämnt till dottercellerna. Slutligen så medför kromosomen en övergripande organisation av varje DNA-molekyl. Denna organisationen reglerar tillgängligheten på DNA och således alla processer som involverar DNA.
Hälften av den molekylära massan hos en eukaryot kromosom är proteiner. I eukaryota celler kallas en given region av DNA med dess associerade proteiner för kromatin, och majoriteten av de associerade proteinerna är små, basiska, och kallas för histoner. Även om de inte är lika vanliga så finns det andra icke-histonproteiner som associerar med eukaryota kromosomer. Här inkluderas ett antal DNA-bindande proteiner som reglerar replikation, reparering, rekombination, och transkriptionen av cellulärt DNA.
Proteinkomponenten hos kromatinet har en annan essentiell funktion: att göra DNAt mer kompakt. Följande beräkning gör dess viktiga funktion tydlig. En mänsklig cell har 3 * 10^9 baspar per haploid (de flesta mänskliga celler är diploida, alltså en dubbel uppsättning kromosomer där hälften kommer från mamman och hälften från pappan, så är den haploida uppsättning hälften av tillgängliga DNAt hos en typisk cell) uppsättning kromosomer. Varje baspar motsvarar en längd längs med DNAt som är 3.4 Ångström. Därför är den totala längden DNA i en haploid cell en meter, eller två meter hos en diploid cell. Eftersom att en typisk cellkärna hos mänskliga celler är mellan 10 till 15 mikrometer, är det klart att DNAt måste packas mycket för att få plats i cellkärnan. Hur är detta möjligt?
Det mesta av packningen i mänskliga celler (och andra eukaryota celler) är resultatet av associationen med histoner och dessa bildar strukturer som kallas nukleosomer. Bildandet av nukleosomer är ett första steg i att packa DNA i en form där dess längd reduceras 10.000-falt. Men att packa DNA har ett pris. Att packa DNA med histoner minskar DNAets tillgänglighet. Denna otillgängligheten kan krocka med processer så som replikation, reparering, rekombination, och transkription. Eukaryota celler utnyttjar denna inhibitoriska effekt för att reglera uttrycket av gener. Genom att modifiera histoner möjliggörs att proteiner kan interagera med dessa specifika regionerna. Dessa modifieringar görs möjliga genom enzymer som modifierar eller flyttar på nukleosomerna. Dessa processer är lokala och dynamiska, vilket tillåter enzymer och reglerande proteiner att få tillgång till kromosomen och vid olika tidpunkter.
Prokaryota celler har vanligtvis mindre genom, men det är även viktigt för dessa att packa sitt DNA. Escherichia coli måste packa sin 1 millimeter kromosom i en cell som är endast 1 mikrometer lång. Det är inte lika klart hur bakteriella genom är packade. Bakterier har inga histoner eller nukleosomer, däremot har de andra små basiska proteiner som troligtvis har en liknande funktion.
På bilden syns histonproteiner med DNA virat runt.
Kopieantalet av ribosomalt RNA (rrn) operon är en karaktäristisk egenskap hos bakteriella genom. Det influerar tillgängligheten på rRNA, vilket i sin tur bestämmer antalet ribosomer, som har en nyckelroll i cellulär fysiologi och ekonomi. Kopieantalet varierar mellan ett till femton i olika bakteriella genom, där högre kopieantal tenderar att hittas i snabbt växande organismer, såväl som hos de med relativt stora genom. Stora genom har kapacitet att koda för multipla kaskader för upptag och användning av näringsämnen vilket främjar en livsstil där anpassning till diverse miljöer är möjligt. I kontrast så tenderar bakterier med mindre genom som lever i stabila och näringsfattiga miljöer att ha ett lågt antal rrn operon. Det tros att antalet rrn operon reflekterar organismens ekologiska strategi.
Bakterier har evolverat för att maximera tillväxt. Snabb anpassning till en ökad tillgång till näring kräver tillgång på tillgängliga ribosomer. Antalet tillgängliga ribosomer beror huvudsakligen på tillgången av ribosomalt RNA (rRNA), som reglerar tillgången på ribosomala proteiner genom en feed-back mekanism. I snabbt växande E. coli är upp emot 85% av det totala RNAt rRNA. För att tillgodose cellen med denna tillgång på rRNA finns vanligtvis flera kopior av rrn operon i deras genom, och när bakterierna växer snabbt är de flesta RNA-polymerasen tilldelade uppgiften att transkribera dessa operon. Att syntetisera ribosomer är kostsamt ur ett energiperspektiv, och ett överskott av ribosomer kan leda till suboptimal tillväxt. Därför är uttrycket av rrn-operon reglerat och anpassas snabbt till cellens behov genom feed-back reglering. Till exempel, om det råder brist på tillgängliga aminosyror och nukleotider så nedregleras uttrycket av rrn-operon.
De GC-rika genomen hos de gram-positiva bakterierna Streptomyces kodar för ett brett spektrum av genkluster involverade i produktionen av sekundära metaboliter som leder till produktionen av farmaceutiska och industriellt viktiga antibiotikor, anticancer-, antisvampläkemedel, insekticider och herbicider.
Av streptomyceterna karaktäriseras Streptomyces venezuelae av dess förmåga att producera kloramfenikol, jadomycin, och pikromycin. Arten betraktas även som en framväxande modellorganism på grund av dess förmåga att växa snabbt, att den är lätt att genetiskt manipulera, att den inte bildar så kallade mycelklumpar, och för att den kan sporulera i flytande media. Enligt vår vetskap finns det 29 S. venezuelae stammar varav tre av dessa (S. venezuelae ATCC 10712, NRRL B-65442, and ATCC 15439) har använts för att syntetisera sekundära metaboliter.
S. venezuelae stam ATCC 10712 producerar kloramfenikol, vilken är en bredspektrum-antibiotika och kan användas för att behandla inflammation i ögats bindehinna, hjärnhinneinflammation, tyfoidfeber. Dessutom kan den under stressade förhållanden producera jadomycin som är en antibiotika som kan användas för att behandla behandlingsresistent bröstcancer. Många sekundära metaboliter, många andra sekundära metaboliter, inkluderat venemycin, watasemycin, isodauc-8-en-11-ol, venezuelin, gaburediner, och foroxymithine, upptäcktes också i denna stammen.
NRRL B-65442 är också känd för att producera kloramfenikol.
Avslutningsvis behandlar vi även stammen ATCC 15439, som främst producerar pikromycinderivat på grund av dess förmåga att producera olika makrolider från ett enda genkluster. Eftersom att den växer snabbt och är relativt lätt att manipulera genetiskt har ATCC 15439 även använts för att uttrycka sekundära metaboliter som hämtats från andra organismer.
Streptomyces-bakterier uppskattas ha funnits på jorden i ungefär 400 millioner år. Men, det är endast under det senaste århundradet som de fått den uppmärksamhet som de rikligt förtjänar.1943 beskrevs Streptomyces för första gången som aerobiska, filmentösa, och sporskapande bakterier. Namnet härstammar från latinska ordet Strepto (skruvad) och myces (svamp). Trots referensen till svampar, så har dessa mikrober och deras släktingar varit erkända som bakterier åtminstone sedan 1940-talet. Det finns idag >1,100 namngivna streptomyceter, vilket gör dem till ett av de största bakteriella släktena.
Streptomyceter är rikligt förekommande i världen runtomkring oss och kan lätt odlas. De är mest kända som jordbakterier; men de kan också hittas i marina sediment och i färskvattensekosystem. Medan den största majoriteten av streptomyceter som studerats till idag är frilevande, så har det på senare år blivit uppenbart att dessa mikrober även leva i association med andra organismer, så som insekter, svampar, och växter. Värt att nämna är att det endast finns ett fåtal Streptomyces arter som kan orsaka sjukdom hos människor.
Det finns en mängd egenskaper som har gjort streptomyceter till fascinerande organismer att studera. Några av dessa är att de har linjära kromosomer till skillnad från många andra bakterier som har cirkulära kromosomer, deras svampliknande sätt att växa på, och deras imponerande metaboliska förmåga, inkluderat deras förmåga att producera antibiotikor bioaktiva molekyler.
Precis som för många frilevande bakterier har streptomyceter stora kromosomer som sträcker sig 6 till 13 megabaspar. Dessutom har Streptomyces-kromosomer en starkt skev genomisk komposition där 70% av DNAt består av G/C-baser. Eftersom att kromosomen är linjär skapar detta unika utmaningar när kromosomen replikeras, särskilt när ändarna ska dupliceras. Kromosomen är organiserad på ett sätt där gener essentiella för livskraft går att finna runt om den punkt där genomet replikeras först, medan denna region är flankerad av "armar" där många av de art-specifika generna är lokaliserade, inkluderat majoriteten av de genkluster som används för att produceras biosyntetiska molekyler.
Streptomyces venezuelae är släkting med Mycobacterium tuberculosis. Det har visat sig att M. tuberculosis har homologer av generna vi studerar. Vi vet väldigt lite om genernas funktion i S. venezuelae men intressant är att i M. tuberculosis verkar genen uttryckas starkt när den håller på att ätas upp av en makrofag. Det finns en studie som indikerar att en av generna kan förhindra apoptos (ett sorts cellulärt självmord). Mekanismen verkar vara följande - en av genprodukterna utsöndras i omgivningen och binder till makrofagens serinproteas cathepsinG på membranet och inhiberar dess enzymatiska aktivitet och nedströmsaktiveringen av kaspas-1 och förhindrar således apoptos. Ska diskuterar detta med min professor.
På bilden syns Rv3364cs struktur framtagen av Alphafold.
Ett sätt för att hitta homologer (gener som är besläktade) kan vara att göra en så kallad BLAST (Basic Local Alignment Search Tool) sökning. BLASTen hittar regioner av lokal likhet mellan protein- eller nukleotidsekvenser. Programmet jämför nukleotid- eller proteinsekvenser med sekvenser i en databas och beräknar den statistiska signifikansen för en match.
Genom att förse BLAST med sekvens till ett av de proteiner vi undersöker beräknas det finnas 8 homologer i genomet (vår gen inkluderat). Vi har knockat dessa generna redan och undersöker i dagsläget deras funktion. Generna verkar ha en funktion i bakteriens morfologi då vi observerat skillnader i fenotyp mellan vildtypen och mutanterna. Jag har jobbat de senaste dagarna med att etablera en metod för att mäta dessa skillnader.
Hur som helst, genom att ha erhållit sekvenserna kan jag påbörja enklare bioinformatiska analyser för att förstå generna på sekvensnivå. Börjar nog med att skriva ett skript för att beräkna GC-innehållet för varje gen.
Sedan senast har jag varit med och tagit fram en teaterföreställning, blivit medförfattare till en bok, och är nu forskarassistent igen.
Jag snubblade in på teater efter att ha blivit tillfrågad om jag ville medverka i en produktion med fokus på psykisk ohälsa. Jag kände mig tvungen att tacka ja. Det var spännande att skriva manus och att få se föreställningen växa fram. Vi spelade inför publik och fick stående ovationer. Tror den träffade i hjärtat eftersom att publiken både skrattade och grät. Efter det så fick jag förfrågan om att medverka som författare till en bok på samma tema. Ett år senare återvände jag till forskarvärlden. Just nu är jag involverad i ett projekt där vi försöker att förstå och kvantifiera olika egenskaper hos bakterier som är kopplade till dess morfologi.