Komponenty

Google kvůli chybějícímu pokrytí výpadků Apps

Racism, School Desegregation Laws and the Civil Rights Movement in the United States

Racism, School Desegregation Laws and the Civil Rights Movement in the United States
Anonim

Nedávné výpadky, které ovlivňují službu Google Apps, dostaly z technologického tisku nepřiměřeně velké množství pokrytí, což vedlo k nesprávné představě o stabilitě této hostitelské platformy pro spolupráci a komunikaci.

To je názor společnosti Matthew Glotzbach, ředitele pro řízení produktů společnosti Google, který nedávno diskutoval o tomto problému s IDG News Service, což je jeden z novinek, o kterých se domnívá, že Google vyvstal problém.

Glotzbachův názor, který on popsal v nedávném blogu, je, že dostupnost a výkon webového hostovaného softwaru, jako je Google Apps, je podrobnější, protože jeho výpadky se veřejně vyskytují v cloudu Internet. Tisková pokrytí vytváří špatné vnímání celkové spolehlivosti aplikací v cloudu oproti softwaru na místě.

Například dostupnost služby Gmail, měřená jako průměrná doba upgradu na uživatele podle chyb na straně serveru, byla na sever od 99,9 procento za poslední rok, což podle Glotzbachu činí zhruba 10 až 15 minut výpadků za měsíc. To je méně, než poukazuje na průměrné neplánované výpadky o 30 až 60 minut, které podle nedávné skupiny Radicati zasáhly e-mailové systémy na místě, které také stály za nákup, instalaci a údržbu než služba Google Apps.

V rozhovoru uvedl Glotzbach to, co Google považuje za správný pohled na několik výpadků v srpnu a říjnu, které zanechaly některým uživatelům Apps přístup k jejich službě Gmail po dobu 24 hodin nebo více. Upravená verze konverzace následuje:

IDG News Service: Chtěli byste shrnout hlavní body vašeho nedávného příspěvku na blogu o spolehlivosti a výkonu Gmailu a aplikací?

Matthew Glotzbach: Spolehlivost celkového cloudu je pod kontrolou, než je spolehlivost průměrného podnikového IT systému, a to je v pořádku. Myslím, že je dobré držet mrak na vyšší úrovni. Potenciální vnímání lidí však může být nadhodnoceno vzhledem k realitě. Právě teď, když máme nejmenší problém, který může mít vliv na nekonečně malý počet lidí, je to zvedeno a mluví se o tom, jako by to ovlivnilo velkou část [uživatelů.] Neříkám, že je přijatelné mít [výpadky]. Uvědomuji si, že očekávání je 100% spolehlivost a to je cíl: být 100% spolehlivý, takže není diskuse, protože je vždy k dispozici. To je zlatý standard, který jsme získali s Google.com, a to je místo, kde chceme získat Google Apps také.

IDGNS: Proč zažíváte výpadky 24 hodin plus v Gmailu Apps?

Glotzbach: Je to velmi vzácné, že každý uživatel je pro tuto dobu. Dokonce i když je hlášení o výpadku, je-li celková doba výpadku 24 hodin nebo 12 hodin, ať je tomu cokoliv, je velmi běžné, že během tohoto období může být uživatel postižen pouze 10 minut nebo něco podobného.

Pokud jde o to, jak může být uživatel po určitou dobu v provozu, závisí to na scénáři selhání. Všichni uživatelé mají dvojí doménu, což znamená, že jejich data jsou zobrazována na dvou samostatných místech, takže existuje redundantní živá kopie jejich dat. Vždy, když dojde k výpadku, drtivá většina - 99 procentních procent lidí - nemá žádný problém, protože jsme je automaticky nezdařili na druhé místo.

Tam, kde existují problémy, t z nějakého důvodu tento uživatel překročí [na zálohu] - v účtu se vyskytla chyba nebo master a podřízený [kopie] jsou mimo synchronizaci. Takže za několika okolností jsme nemohli uživatelem selhat a my nemůžeme obnovit přístup tohoto uživatele k této službě, dokud obnovíme fyzické umístění. Toto je oblast, ve které se neustále zlepšujeme a některé z věcí, které jsme udělali v důsledku našeho učení během posledních několika měsíců, to řeší.

IDGNS: Když mluvím s postiženými administrátory aplikací, mnozí říkají, že by chtěli, aby společnost Google byla transparentnější v tom, jak uznává problémy v diskusním fóru aplikace Apps Help a aby nabídla další podrobnosti. Například Salesforce a Amazon mají veřejné webové stránky, kde v reálném čase oznamují výkonnost a dostupnost svých hostovaných služeb a aplikací.

Glotzbach: Stále usilujeme o větší průhlednost, aby naši uživatelé všech tvarů a velikostí, ať už jsou to spotřebitelé nebo největší platební společnosti [společnosti Apps Premier] a všichni mezi nimi. Systémové a velmi veřejné publikování na našich uživatelských fórech vždy, když nastane problém, a kdykoli je to možné, nabízíme práci.

Jednou z vnímaných problémů nebo problémů s průhledností je to, že provozujeme mnoho služeb a historicky jsme se snažili zaměřit zasílání zpráv na lidi, které by to ovlivnilo, takže máme diskusní fóra pro Gmail, Google Docs a tak dále. Určitě slyšíme, co lidé říkají a odpovídají na zpětnou vazbu takovým průhledným způsobem, a také, zda potřebujeme centralizované místo jako Amazon a Salesforce.

Nicméně, Amazon i Salesforce nabízejí mnohem nižší služby. To neznamená, že nerešpektujeme, co dělají, ale pracujeme mnohem větší měrou. Informace, které poskytujeme, jsou stejně transparentní nebo více než to, co poskytují. Pokud se dostanete na řídicí panel Salesforce Trust a kliknete na problém, říká se něco jako "v tento den došlo k problému na dvě hodiny." Opět nenaznačuji, že to nestačí, ale naznačuji, že pro naše uživatele také neposkytujeme průhlednost.

IDGNS: Po výpadcích Gmailu v srpnu jste nabídli úroveň služeb smlouvu o kreditu zákazníkům společnosti Apps Premier a načrtnutými plány na zlepšení komunikace v průběhu problémů. Jak to děláme?

Glotzbach: Již do 48 hodin produkujeme zprávy o incidentu a sdílíme je s našimi zákazníky z edice Premier. Stejně vidíte systematičtější a včasné přidávání problémů prostřednictvím stávajících kanálů. Ovládací panel, skutečná aplikace, na kterou se uživatelé mohou dostat do stavu [check for outage status], je v pracích.

IDGNS: Přesto někteří administrátoři Apps, zejména ti Standard Edition, kteří nemají telefonickou podporu, rychleji o zveřejnění potvrzení o problému a podrobnostech v oficiálním fóru Apps

Glotzbach: Neustále se snažíme zlepšit službu a v případě problémů reagovat citlivěji a poskytovat vysoce kvalitní data. Kdykoli někdo nemá přístup k službě, je to důvod k obavám a my jsme na ni velmi citliví.

[Nicméně] upozorňuji na pragmatické srovnání toho, jak často lidské firemní poštovní systémy klesají, a pětičlenná společnost, která používá bezplatnou standardní verzi. Jejich alternativy je zajímavé podívat se: mohou platit stovky dolarů za místo pro hostitelskou platformu obchodních pošty od jiného poskytovatele nebo zaplatit desítky tisíc dolarů za běh svého vlastního serveru. A i kdyby to udělali, jejich záruky uptime by byly menší než skutečná doba, po kterou jsou z aplikace Apps vidět.

IDGNS: Ale poskytovatelé cloud computingu se nedostanou do kluzkého svahu, když začnou ospravedlňovat, jaké problémy s výkonem se setkají tím, že poukazuje na odlišný model softwaru? Velkým důvodem, proč lidé přicházejí do mraků, je odevzdat úkoly instalace a údržby softwaru někomu, jako je Google, který jim nabízí lepší a levnější práci. Ale nemyslím si, že by očekávali, že budou na 36 hodin, takže si možná budou přát mít poštovní server doma.

Glotzbach: Absolutně. Nikdy bychom nechtěli, aby někdo byl na nějaký počet hodin, nebo na nějaký počet minut. Bohužel mluvíme o případech na okraji. Naším cílem je mít 100% spolehlivost a dostáváme se stále bližší týden po týdnu. Když se setkáte s doslova stovkami milionů aktivních uživatelů nebo účtů, bohužel, dokud se nedostanete docela 100%, i když máte 99,